本文最后更新于 2025-11-20T20:13:03+08:00
Classical mechanics
references:
[1] 杨望,理论力学讲义
[2] H.Goldstein, C. Poole, J.Safko, Classical mechanics , 高等教育出版社
[3] 高显,经典力学,科学出版社
[4] 金尚年,理论力学(第三版),高等教育出版社
Chapter 0 多元函数的导数和微分
设 f ( x 1 , … , x n ) f\left(x_1,\dots,x_n\right) f ( x 1 , … , x n ) 是 n n n 个变量 x 1 , … , x n x_1,\dots,x_n x 1 , … , x n 的光滑函数,其中 x i ∈ R , 1 ≤ i ≤ n , f ( x 1 , … , x n ) ∈ R x_i\in \R,1\leq i\leq n,f\left(x_1,\dots,x_n\right)\in \R x i ∈ R , 1 ≤ i ≤ n , f ( x 1 , … , x n ) ∈ R .我们采取下述记号,
f [ x j ] = f ( x 1 , … , x n ) f[x_j]=f\left(x_1,\dots,x_n\right)
f [ x j ] = f ( x 1 , … , x n )
那么偏导数可以写为
∂ f ∂ x i [ x j ] = lim ϵ → 0 f [ x j + ϵ δ i j ] − f [ x j ] ϵ (0.1) \frac{\partial f}{\partial x_i}[x_j]=\lim_{\epsilon \to 0}\frac{f[x_j+\epsilon\delta_{ij}]-f[x_j]}{\epsilon}\tag{0.1}
∂ x i ∂ f [ x j ] = ϵ → 0 lim ϵ f [ x j + ϵ δ ij ] − f [ x j ] ( 0.1 )
当自变量有如下变换时
x 1 → x 1 + Δ x 1 , x 2 → x 2 + Δ x 2 , … , x n → x n + Δ x n x_1\to x_1+\Delta x_1,x_2\to x_2+\Delta x_2,\dots,x_n\to x_n+\Delta x_n
x 1 → x 1 + Δ x 1 , x 2 → x 2 + Δ x 2 , … , x n → x n + Δ x n
(全)微分可以写成
Δ f = f [ x j + Δ x j ] − f [ x j ] = ∑ i = 1 n ∂ f ∂ x i [ x j ] Δ x i + O ( Δ x i Δ x j ) (0.2) \begin{aligned}
\Delta f&=f[x_j+\Delta x_j]-f[x_j]\\
&=\sum_{i=1}^n\frac{\partial f}{\partial x_i}[x_j]\Delta x_i+O\left(\Delta x_i\Delta x_j\right)
\end{aligned}\tag{0.2}
Δ f = f [ x j + Δ x j ] − f [ x j ] = i = 1 ∑ n ∂ x i ∂ f [ x j ] Δ x i + O ( Δ x i Δ x j ) ( 0.2 )
Chapter 1 变分法
1.1 泛函
函数就是具体的映射关系
f : t ↦ y = f ( t ) (1.1) f:t\mapsto y=f\left(t\right)\tag{1.1}
f : t ↦ y = f ( t ) ( 1.1 )
1.1.1 泛函的概念
泛函,即函数到数的影射,记函数集合 F = { f 1 , f 2 , f 3 , ⋯ } \mathcal{F}=\{f_1,f_2,f_3,\cdots\} F = { f 1 , f 2 , f 3 , ⋯ } .函数 f f f 的泛函记作 S [ f ] S[f] S [ f ] ,即
f ↦ S = S [ f ] , F → C (1.2) f\mapsto S=S[f],\quad\mathcal{F}\to \mathbf{C}\tag{1.2}
f ↦ S = S [ f ] , F → C ( 1.2 )
1.1.2 泛函的具体形式
三维空间中曲面方程记为 z = ϕ ( x , y ) z=\phi\left(x,y\right) z = ϕ ( x , y ) ,则曲面面积 A A A 为二元函数 ϕ ( x , y ) \phi\left(x,y\right) ϕ ( x , y ) 的泛函
A = A [ ϕ ] = ∬ 区域 d x d y 1 + ( ∂ ϕ ∂ x ) 2 + ( ∂ ϕ ∂ y ) 2 A=A[\phi]=\iint_{区域}\mathrm{d}x\mathrm{d}y\sqrt{1+\left(\frac{\partial\phi}{\partial x}\right)^2+\left(\frac{\partial \phi}{\partial y}\right)^2}
A = A [ ϕ ] = ∬ 区域 d x d y 1 + ( ∂ x ∂ ϕ ) 2 + ( ∂ y ∂ ϕ ) 2
经典力学种所遇到的泛函通常可以写成积分形式:
S [ f ] = ∫ t 1 t 2 d t L ( t , f ( t ) , f ′ ( t ) , f ′ ′ ( t ) , ⋯ ) (1.3) S[f]=\int_{t_1}^{t_2}\mathrm{d}tL\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right)\tag{1.3}
S [ f ] = ∫ t 1 t 2 d t L ( t , f ( t ) , f ′ ( t ) , f ′′ ( t ) , ⋯ ) ( 1.3 )
这里的被积函数 L = L ( t , f ( t ) , f ′ ( t ) , f ′ ′ ( t ) , ⋯ ) L=L\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right) L = L ( t , f ( t ) , f ′ ( t ) , f ′′ ( t ) , ⋯ ) 是函数 f ( t ) f\left(t\right) f ( t ) 及其导数的一般函数.
1.2 变分
1.2.1 变分的概念
泛函为函数到数的映射,函数本身的无穷小变化,以及由之引起的泛函的变化即变分.若函数 f ( t ) f\left(t\right) f ( t ) 变成了另外一个函数 f ( t ) → f ~ ( t ) f\left(t\right)\to \tilde{f}\left(t\right) f ( t ) → f ~ ( t ) ,且假设两者相差无穷小,则函数 f ( t ) f\left(t\right) f ( t ) 的变分 δ f \delta f δ f 定义为
δ f ( t ) : = f ~ ( t ) − f ( t ) (1.4) \boxed{\delta f\left(t\right):=\tilde{f}\left(t\right)-f\left(t\right)} \tag{1.4}
δ f ( t ) := f ~ ( t ) − f ( t ) ( 1.4 )
函数的变分 δ f \delta f δ f 是因为函数本身发生了变化,而与自变量 t t t 无关
f ( t ) → f ~ ( t ) ≡ ( f + δ f ) ( t ) = f ( t ) + δ f ( t ) (1.5) f\left(t\right)\to\tilde{f}\left(t\right)\equiv\left(f+\delta f\right)\left(t\right)=f\left(t\right)+\delta f\left(t\right)\tag{1.5}
f ( t ) → f ~ ( t ) ≡ ( f + δ f ) ( t ) = f ( t ) + δ f ( t ) ( 1.5 )
1.2.2 变分的运算规则
函数的变分和微分同为无穷小变化,形式上的运算规则基本相同.
δ ( f n ) = n f n − 1 δ f δ ( a f 1 + b f 2 ) = a δ f 1 + b δ f 2 , δ ( f 1 f 2 ) = ( δ f 1 ) δ f 2 + δ f 1 ( δ f 2 ) (1.6) \begin{aligned}
&\delta\left(f^n\right)=nf^{n-1}\delta f\\
\delta\left(af_1+bf_2\right)=a\delta f_1&+b\delta f_2,\quad \delta\left(f_1f_2\right)=\left(\delta f_1\right)\delta f_2+\delta f_1\left(\delta f_2\right)
\end{aligned}\tag{1.6}
δ ( a f 1 + b f 2 ) = a δ f 1 δ ( f n ) = n f n − 1 δ f + b δ f 2 , δ ( f 1 f 2 ) = ( δ f 1 ) δ f 2 + δ f 1 ( δ f 2 ) ( 1.6 )
另一个重要且非常有用的性质是,变分和微分可以交换顺序.
δ ( d f ) = d ( δ f ) (1.7) \boxed{\delta\left(\mathrm df\right)=\mathrm d\left(\delta f\right)}\tag{1.7}
δ ( d f ) = d ( δ f ) ( 1.7 )
p r o o f proof p roo f
f ~ ( t + d t ) − f ( t ) = f ~ ( t + d t ) − f ~ ( t ) + f ~ ( t ) − f ( t ) = δ f + d f + d ( δ f ) = f ~ ( t + d t ) − f ( t + d t ) + f ( t + d t ) − f ( t ) = δ f + d f + δ ( d f ) \begin{aligned}
\tilde{f}\left(t+\mathrm dt\right)-f\left(t\right)&=\tilde{f}\left(t+\mathrm dt\right)-\tilde f\left(t\right)+\tilde f\left(t\right)-f\left(t\right)=\delta f+\mathrm df+\mathrm d\left(\delta f\right)\\
&=\tilde{f}\left(t+\mathrm dt\right)-f\left(t+\mathrm dt\right)+f\left(t+\mathrm dt\right)-f\left(t\right)=\delta f+\mathrm df+\delta\left(\mathrm df\right)
\end{aligned}
f ~ ( t + d t ) − f ( t ) = f ~ ( t + d t ) − f ~ ( t ) + f ~ ( t ) − f ( t ) = δ f + d f + d ( δ f ) = f ~ ( t + d t ) − f ( t + d t ) + f ( t + d t ) − f ( t ) = δ f + d f + δ ( d f )
因此可以推出
δ ( d d t f ( t ) ) = d d t ( δ f ( t ) ) (1.8) \boxed{\delta\left(\frac{\mathrm d}{\mathrm dt}f\left(t\right)\right)=\frac{\mathrm d}{\mathrm dt}\left(\delta f\left(t\right)\right)}\tag{1.8}
δ ( d t d f ( t ) ) = d t d ( δ f ( t ) ) ( 1.8 )
1.3 泛函导数
1.3.1 泛函导数的概念
对于一阶导数
d f ( t ) = d f ( t ) d t d t \mathrm d f\left(t\right)=\frac{\mathrm d f\left(t\right)}{\mathrm dt}\mathrm dt
d f ( t ) = d t d f ( t ) d t
类比普通函数的导数.对于泛函 S [ f ] S[f] S [ f ] ,其变分是由函数的变分引起的:
S [ f ~ ] = S [ f + ϵ δ f ] = S [ f ] + ϵ δ S [ f ] + ϵ 2 2 δ 2 S [ f ] + ϵ 3 3 ! δ 3 S [ f ] + ⋯ (1.9) \begin{equation}
\begin{aligned}
S[\tilde f]=&S[f+\epsilon\delta f]\\
=&S[f]+\epsilon\delta S[f]+\frac{\epsilon^2}{2}\delta^2S[f]+\frac{\epsilon^3}{3!}\delta^3S[f]+\cdots
\end{aligned}
\end{equation}\tag{1.9}
S [ f ~ ] = = S [ f + ϵδ f ] S [ f ] + ϵδ S [ f ] + 2 ϵ 2 δ 2 S [ f ] + 3 ! ϵ 3 δ 3 S [ f ] + ⋯ ( 1.9 )
定义
δ S [ f ] = ∫ d t δ S δ f ( t ) δ f ( t ) (1.10) \boxed{\delta S[f]=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.10}
δ S [ f ] = ∫ d t δ f ( t ) δ S δ f ( t ) ( 1.10 )
其中 δ S \delta S δ S 是泛函的一阶变分, δ S δ f ( t ) \frac{\delta S}{\delta f\left(t\right)} δ f ( t ) δ S 即一阶泛函导数 .
类比函数的高阶导数,高阶泛函导数定义为
δ 2 S [ f ] : = ∫ d t 1 ∫ d t 2 δ 2 S δ f ( t 1 ) δ f ( t 2 ) δ f ( t 1 ) δ f ( t 2 ) (1.11) \delta^2S[f]:=\int\mathrm dt_1\int \mathrm dt_2\frac{\delta ^2 S}{\delta f\left(t_1\right)\delta f\left(t_2\right)}\delta f\left(t_1\right)\delta f\left(t_2\right) \tag{1.11}
δ 2 S [ f ] := ∫ d t 1 ∫ d t 2 δ f ( t 1 ) δ f ( t 2 ) δ 2 S δ f ( t 1 ) δ f ( t 2 ) ( 1.11 )
1.3.2 泛函导数的操作定义
将 S [ f + ϵ δ f ] S[f+\epsilon\delta f] S [ f + ϵδ f ] 视为 ϵ \epsilon ϵ 的普通函数,将式(1.9)视作关于 ϵ \epsilon ϵ 的普通泰勒展开:
S [ f + ϵ δ f ] = S [ f ] + ϵ d d ϵ S [ f + ϵ δ f ] ∣ ϵ = 0 + ϵ 2 2 d 2 d ϵ 2 S [ f + ϵ δ f ] ∣ ϵ = 0 + ⋯ (1.12) S[f+\epsilon\delta f]=S[f]+\left.\epsilon\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\left.\frac{\epsilon^2}{2}\frac{\mathrm d^2}{\mathrm d \epsilon^2}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\cdots \tag{1.12}
S [ f + ϵδ f ] = S [ f ] + ϵ d ϵ d S [ f + ϵδ f ] ϵ = 0 + 2 ϵ 2 d ϵ 2 d 2 S [ f + ϵδ f ] ϵ = 0 + ⋯ ( 1.12 )
即有
δ S = d d ϵ S [ f + ϵ δ f ] ∣ ϵ = 0 = ∫ d t δ S δ f ( t ) δ f ( t ) (1.13) \boxed{\delta S=\left.\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.13}
δ S = d ϵ d S [ f + ϵδ f ] ϵ = 0 = ∫ d t δ f ( t ) δ S δ f ( t ) ( 1.13 )
对于式(1.3)形式的泛函
S [ f + δ f ] = ∫ t 1 t 2 d t L ( t , f + δ f , f ′ + δ f ’ , ⋯ ) S[f+\delta f]=\int_{t_1}^{t_2}\mathrm dtL\left(t,f+\delta f,f'+\delta f’,\cdots\right)
S [ f + δ f ] = ∫ t 1 t 2 d t L ( t , f + δ f , f ′ + δ f ’ , ⋯ )
可以得到
δ S = ∫ t 1 t 2 d t d d ϵ L ( t , f + ϵ δ f , f ′ + ϵ δ f ′ , ⋯ ) ∣ ϵ = 0 = ∫ t 1 t 2 d t ( ∂ L ∂ f δ f + ∂ L ∂ f ′ δ f ′ + ⋯ ) ⏟ ≡ δ L (1.14) \begin{equation}
\begin{aligned}
\delta S&=\int_{t_1}^{t_2}\mathrm dt\left .\frac{\mathrm d}{\mathrm d\epsilon}L\left(t,f+\epsilon\delta f,f'+\epsilon\delta f',\cdots\right)\right |_{\epsilon=0}\\
&=\int_{t_1}^{t_2}\mathrm dt\underbrace{\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\cdots\right)}_{\equiv\delta L}
\end{aligned}
\end{equation}\tag{1.14}
δ S = ∫ t 1 t 2 d t d ϵ d L ( t , f + ϵδ f , f ′ + ϵδ f ′ , ⋯ ) ϵ = 0 = ∫ t 1 t 2 d t ≡ δ L ( ∂ f ∂ L δ f + ∂ f ′ ∂ L δ f ′ + ⋯ ) ( 1.14 )
其中被积函数为 L L L 的变分 δ L \delta L δ L ,其与微分 d L \mathrm d L d L 形式全同.这意味着
δ S = δ ( ∫ t 1 t 2 d t L ) = ∫ t 1 t 2 d t δ L (1.15) \delta S=\delta\left(\int_{t_1}^{t_2}\mathrm dtL\right)=\int_{t_1}^{t_2}\mathrm dt\delta L\tag{1.15}
δ S = δ ( ∫ t 1 t 2 d t L ) = ∫ t 1 t 2 d t δ L ( 1.15 )
我们用分部积分的方法进行处理
∂ L ∂ f ′ δ f ′ = 变分和求导交换顺序 d d t ( ∂ L ∂ f ′ δ f ) ⏟ 全导数 − d d t ( ∂ L ∂ f ′ ) δ f (1.16) \frac{\partial L}{\partial f'}\delta f'\xlongequal{变分和求导交换顺序} \underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\delta f\right)}_{全导数}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f\tag{1.16}
∂ f ′ ∂ L δ f ′ 变分和求导交换顺序 全导数 d t d ( ∂ f ′ ∂ L δ f ) − d t d ( ∂ f ′ ∂ L ) δ f ( 1.16 )
类似的
∂ L ∂ f ′ ′ δ f ’ ′ = d d t ( ∂ L ∂ f ′ ′ δ f ′ ) − d d t ( ∂ L ∂ f ′ ′ ) δ f ′ = d d t ( ∂ L ∂ f ′ ′ δ f ′ − d d t ( ∂ L ∂ f ′ ′ ) δ f ) ⏟ 全导数 + d 2 d t 2 ( ∂ L ∂ f ′ ′ ) δ f (1.17) \begin{equation}
\begin{aligned}
\frac{\partial L}{\partial f''}\delta f’' &= \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f'\\
&=\underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f\right)}_{全导数}+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f
\end{aligned}
\end{equation}\tag{1.17}
∂ f ′′ ∂ L δ f ’ ′ = d t d ( ∂ f ′′ ∂ L δ f ′ ) − d t d ( ∂ f ′′ ∂ L ) δ f ′ = 全导数 d t d ( ∂ f ′′ ∂ L δ f ′ − d t d ( ∂ f ′′ ∂ L ) δ f ) + d t 2 d 2 ( ∂ f ′′ ∂ L ) δ f ( 1.17 )
因此
δ S = ∫ t 1 t 2 d t [ ∂ L ∂ f δ f − d d t ( ∂ L ∂ f ′ ) δ f + d 2 d t 2 ( ∂ L ∂ f ′ ′ ) δ f − ⋯ + d B d t ] = ∫ t 1 t 2 d t [ ∂ L ∂ f − d d t ( ∂ L ∂ f ′ ) + d 2 d t 2 ( ∂ L ∂ f ′ ′ ) − ⋯ ] ∂ f + B ∣ t 1 t 2 (1.18) \begin{equation}
\begin{aligned}
\delta S=&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}\delta f-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f-\cdots+\frac{\mathrm d\mathcal B}{\mathrm dt}\right]\\
=&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)-\cdots\right]\partial f+\left.\mathcal B \right |_{t_1}^{t_2}
\end{aligned}
\end{equation}\tag{1.18}
δ S = = ∫ t 1 t 2 d t [ ∂ f ∂ L δ f − d t d ( ∂ f ′ ∂ L ) δ f + d t 2 d 2 ( ∂ f ′′ ∂ L ) δ f − ⋯ + d t d B ] ∫ t 1 t 2 d t [ ∂ f ∂ L − d t d ( ∂ f ′ ∂ L ) + d t 2 d 2 ( ∂ f ′′ ∂ L ) − ⋯ ] ∂ f + B ∣ t 1 t 2 ( 1.18 )
这里 d B d t \frac{\mathrm d\mathcal B}{\mathrm dt} d t d B 代表全导数项,积分到最后得到的 B ∣ t 1 t 2 \left. \mathcal B \right |_{t_1}^{t_2} B ∣ t 1 t 2 被称作边界项 .
两个被积函数“相差全导数”,或者两个积分“相差边界项”,这件事在变分法种非常重要,用 ≃ \simeq ≃ 来表示
L 1 ≃ L 2 ⟺ L 1 = L 2 + d F ( t , f ′ , f ′ ′ , ⋯ ) d t (1.19) \boxed{L_1\simeq L_2 \iff L_1=L_2+\frac{\mathrm dF\left(t,f',f'',\cdots\right)}{\mathrm d t}} \tag{1.19}
L 1 ≃ L 2 ⟺ L 1 = L 2 + d t d F ( t , f ′ , f ′′ , ⋯ ) ( 1.19 )
以及
L 1 ≃ L 2 ⟺ S 1 = S 2 + F ∣ t 1 t 2 L_1\simeq L_2\iff S_1=S_2+\left . F\right |_{t_1}^{t_2}
L 1 ≃ L 2 ⟺ S 1 = S 2 + F ∣ t 1 t 2
式(1.16)和(1.17)可以写成
∂ F ∂ f ′ δ f ′ ≃ − d d t ( ∂ L ∂ f ′ ) δ f ′ , ∂ F ∂ f ′ ′ δ f ′ ′ = d 2 d t 2 ( ∂ L ∂ f ′ ′ ) δ f (1.20) \frac{\partial F}{\partial f'}\delta f'\simeq-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f',\frac{\partial F}{\partial f''}\delta f''=\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f \tag{1.20}
∂ f ′ ∂ F δ f ′ ≃ − d t d ( ∂ f ′ ∂ L ) δ f ′ , ∂ f ′′ ∂ F δ f ′′ = d t 2 d 2 ( ∂ f ′′ ∂ L ) δ f ( 1.20 )
1.3.3 计算一阶泛函导数的标准手续
将变分符号 δ \delta δ 移到积分号内:
δ S = ∫ d t L ( t , f ′ , f ′ ′ , ⋯ ) (1.21) \delta S=\int \mathrm dtL\left(t,f',f'',\cdots\right)\tag{1.21}
δ S = ∫ d t L ( t , f ′ , f ′′ , ⋯ ) ( 1.21 )
按照类似复合函数求导的规则,计算 δ L \delta L δ L
δ S = ∫ d t ( ∂ L ∂ f δ f + ∂ L ∂ f ′ δ f ′ + ∂ L ∂ f ′ ′ δ f ′ ′ + ⋯ ) (1.22) \delta S=\int \mathrm dt\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\frac{\partial L}{\partial f''}\delta f''+\cdots\right) \tag{1.22}
δ S = ∫ d t ( ∂ f ∂ L δ f + ∂ f ′ ∂ L δ f ′ + ∂ f ′′ ∂ L δ f ′′ + ⋯ ) ( 1.22 )
做分部积分
提取 δ f \delta f δ f 前系数,即一阶泛函导数
δ S ≃ ∫ d t [ ∂ L ∂ f − d d t ( ∂ L ∂ f ′ ) + d 2 d t 2 ( ∂ L ∂ f ′ ′ ) + ⋯ ] δ f (1.23) \delta S\simeq\int \mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots\right ]\delta f \tag{1.23}
δ S ≃ ∫ d t [ ∂ f ∂ L − d t d ( ∂ f ′ ∂ L ) + d t 2 d 2 ( ∂ f ′′ ∂ L ) + ⋯ ] δ f ( 1.23 )
δ S δ f = ∂ L ∂ f − d d t ( ∂ L ∂ f ′ ) + d 2 d t 2 ( ∂ L ∂ f ′ ′ ) + ⋯ (1.24) \boxed{\frac{\delta S}{\delta f}=\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots} \tag{1.24}
δ f δ S = ∂ f ∂ L − d t d ( ∂ f ′ ∂ L ) + d t 2 d 2 ( ∂ f ′′ ∂ L ) + ⋯ ( 1.24 )
Example 1.1
考虑泛函 S [ f ] = ∫ d t [ ( f ′ ( t ) ) 2 − ( f ( t ) ) 2 ] S[f]=\int\mathrm dt\left[\left(f'\left(t\right)\right)^2-\left(f\left(t\right)\right)^2\right] S [ f ] = ∫ d t [ ( f ′ ( t ) ) 2 − ( f ( t ) ) 2 ] ,有
δ S = ∫ d t δ ( f ′ 2 − f 2 ) = ∫ d ( 2 f ′ δ f ′ − 2 f δ f ) = ∫ d t ( − 2 f ′ ′ − 2 f ) δ f \begin{aligned}
\delta S=&\int \mathrm dt\delta\left(f'^2-f^2\right)=\int\mathrm d\left(2f'\delta f'-2f\delta f\right)\\
=&\int \mathrm dt\left(-2f''-2f\right)\delta f
\end{aligned}
δ S = = ∫ d t δ ( f ′2 − f 2 ) = ∫ d ( 2 f ′ δ f ′ − 2 f δ f ) ∫ d t ( − 2 f ′′ − 2 f ) δ f
因此一阶泛函导数为
δ S δ f = − 2 f ′ ′ − 2 f \frac{\delta S}{\delta f}=-2f''-2f
δ f δ S = − 2 f ′′ − 2 f
Example 1.2
考虑泛函 S [ f ] = ∫ d t [ f ( t ) f ′ ( t ) + f ′ ( t ) f ′ ′ ( t ) ] S[f]=\int \mathrm dt\left[f\left(t\right)f'\left(t\right)+f'\left(t\right)f''\left(t\right)\right] S [ f ] = ∫ d t [ f ( t ) f ′ ( t ) + f ′ ( t ) f ′′ ( t ) ] ,有
δ S [ f ] = ∫ d t ( δ f f ′ + f δ f ′ + δ f ′ f ′ ′ + f ′ δ f ′ ′ ) = ∫ d t ( f ′ − f ′ + f ′ ′ − f ′ ′ ) δ f = 0 \begin{aligned}
\delta S[f]=&\int \mathrm dt\left(\delta ff'+f\delta f'+\delta f'f''+f'\delta f''\right)\\
=&\int\mathrm dt\left(f'-f'+f''-f''\right)\delta f=0
\end{aligned}
δ S [ f ] = = ∫ d t ( δ f f ′ + f δ f ′ + δ f ′ f ′′ + f ′ δ f ′′ ) ∫ d t ( f ′ − f ′ + f ′′ − f ′′ ) δ f = 0
实际上
f f ′ + f ′ f ′ ′ = d d t ( 1 2 ( f 2 + f ′ 2 ) ) ff'+f'f''=\frac{\mathrm d}{\mathrm dt}\left(\frac 12\left(f^2+f'^2\right)\right)
f f ′ + f ′ f ′′ = d t d ( 2 1 ( f 2 + f ′2 ) )
1.4 泛函极值
1.4.1 泛函极值的必要条件
显然泛函 S [ f ] S[f] S [ f ] 在 f = f ‾ ( t ) f=\overline f\left(t\right) f = f ( t ) 时取极小(大)值时,只有不发生偏移,即 δ f = 0 \delta f=0 δ f = 0 时取极值 .另一方面,由式(1.12),S [ f ‾ + ϵ δ f ] S[\overline f+\epsilon \delta f] S [ f + ϵδ f ] 可看作参数 ϵ \epsilon ϵ 的普通函数,在 ϵ = 0 \epsilon=0 ϵ = 0 处取极值.结合泛函导数的定义,有
δ S [ f ‾ ] = ∫ d t δ S [ f ] δ f δ f ∣ f ‾ = d S [ f ‾ + ϵ δ f ] d ϵ ∣ ϵ = 0 = 0 (1.25) \delta S[\overline f]=\int \mathrm dt\left .\frac{\delta S[f]}{\delta f}\delta f\right|_{\overline f}=\left .\frac{\mathrm dS[\overline f+\epsilon \delta f]}{\mathrm d\epsilon}\right |_{\epsilon =0}=0\tag{1.25}
δ S [ f ] = ∫ d t δ f δ S [ f ] δ f f = d ϵ d S [ f + ϵδ f ] ϵ = 0 = 0 ( 1.25 )
由此得到泛函在 f = f ‾ ( t ) f=\overline f\left(t\right) f = f ( t ) 时取极值,即要求泛函的一阶变分为零:
δ S [ f ‾ ] = 0 (1.26) \boxed{\delta S[\overline f]=0}\tag{1.26}
δ S [ f ] = 0 ( 1.26 )
1.4.2 欧拉-拉格朗日方程
一类常见的泛函具有如下形式
S [ f ] = ∫ d t L ( t , f ( t ) , f ′ ( t ) ) (1.27) S[f]=\int \mathrm dt L\left(t,f\left(t\right),f'\left(t\right)\right)\tag{1.27}
S [ f ] = ∫ d t L ( t , f ( t ) , f ′ ( t ) ) ( 1.27 )
根据式(1.26),泛函取极值的必要条件是
− δ S δ f ≡ d d t ( ∂ L ∂ f ′ ) − ∂ L ∂ f = 0 (1.28) -\frac{\delta S}{\delta f}\equiv\boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)-\frac{\partial L}{\partial f}=0}\tag{1.28}
− δ f δ S ≡ d t d ( ∂ f ′ ∂ L ) − ∂ f ∂ L = 0 ( 1.28 )
式(1.28)是关于 f ( t ) f\left(t\right) f ( t ) 的二阶微分方程,被称为变分问题的欧拉-拉格朗日方程 (Euler-Lagrange equation).
对 L L L 直接求全导数
d L d t = ∂ L ∂ t + ∂ L ∂ f f ′ + ∂ L ∂ f ′ f ′ ′ = ∂ L ∂ t + ∂ L ∂ f f ′ + d d t ( ∂ L ∂ f ′ f ′ ) − d d t ( ∂ L ∂ f ′ ) f ′ = ∂ L ∂ t − ( ∂ L ∂ f − d d t ( ∂ L ∂ f ′ ) ) ⏟ = 0 f ′ + d d t ( ∂ L ∂ f ′ f ′ ) \begin{aligned}
\frac{\mathrm dL}{\mathrm dt}=&\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\partial L}{\partial f'}f''=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)f'\\
=&\frac{\partial L}{\partial t}-\underbrace{\left(\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\right)}_{=0}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right)
\end{aligned}
d t d L = = ∂ t ∂ L + ∂ f ∂ L f ′ + ∂ f ′ ∂ L f ′′ = ∂ t ∂ L + ∂ f ∂ L f ′ + d t d ( ∂ f ′ ∂ L f ′ ) − d t d ( ∂ f ′ ∂ L ) f ′ ∂ t ∂ L − = 0 ( ∂ f ∂ L − d t d ( ∂ f ′ ∂ L ) ) f ′ + d t d ( ∂ f ′ ∂ L f ′ )
因此当欧拉-拉格朗日方程(1.28)满足时,下式也成立
d d t ( ∂ L ∂ f ′ f ′ − L ) + ∂ L ∂ t = 0 (1.29) \boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'-L\right)+\frac{\partial L}{\partial t}=0} \tag{1.29}
d t d ( ∂ f ′ ∂ L f ′ − L ) + ∂ t ∂ L = 0 ( 1.29 )
一个立即的结论是,若 L L L 不显含积分变量 t t t
∂ L ∂ t = 0 ⇒ ∂ L ∂ f ′ f ′ − L = c o n s t (1.30) \frac{\partial L}{\partial t}=0\tag{1.30}\Rightarrow \frac{\partial L}{\partial f'}f'-L=const
∂ t ∂ L = 0 ⇒ ∂ f ′ ∂ L f ′ − L = co n s t ( 1.30 )
对于更一般的泛函式(1.3),其取极值的必要条件是
δ S δ f = ∑ n = 0 ( − 1 ) n d n d t n ( ∂ L ∂ f ( n ) ) = 0 (1.31) \frac{\delta S}{\delta f}=\sum_{n=0}\left(-1\right)^n\frac{\mathrm d^n}{\mathrm dt^n}\left(\frac{\partial L}{\partial f^{\left(n\right)}}\right)=0\tag{1.31}
δ f δ S = n = 0 ∑ ( − 1 ) n d t n d n ( ∂ f ( n ) ∂ L ) = 0 ( 1.31 )
Example 1.3
平面上两固定点直接由任意光滑曲线连接,曲线方程基座 y = f ( x ) y=f\left(x\right) y = f ( x ) ,曲线长度为 S = ∫ d x 1 + ( f ′ ( x ) ) 2 S=\int \mathrm dx\sqrt{1+\left(f'\left(x\right)\right)^2} S = ∫ d x 1 + ( f ′ ( x ) ) 2 ,变分得到
δ S = ∫ d x f ′ 1 + f ′ 2 δ f ′ = − ∫ d x f ′ ′ ( 1 + f ′ 2 ) 3 / 2 δ f \delta S=\int \mathrm dx\frac{f'}{\sqrt{1+f'^2}}\delta f'=-\int \mathrm dx\frac{f''}{\left(1+f'^2\right)^{3/2}}\delta f
δ S = ∫ d x 1 + f ′2 f ′ δ f ′ = − ∫ d x ( 1 + f ′2 ) 3/2 f ′′ δ f
于是曲线长度取极值的必要条件即 f ( x ) f\left(x\right) f ( x ) 满足 f ′ ′ ( 1 + f ′ 2 ) 3 / 2 = 0 \frac{f''}{\left(1+f'^2\right)^{3/2}}=0 ( 1 + f ′2 ) 3/2 f ′′ = 0 ,其等价于 f ′ ′ = 0 f''=0 f ′′ = 0 ,通解为 y = a x + b y=ax+b y = a x + b .
Example 1.4(最速下降曲线)
当小球下降到 y y y 处时,1 2 m v 2 = m g y \frac 12m\boldsymbol{v}^2=mgy 2 1 m v 2 = m g y ,因此速度大小 v ≡ ∣ v ∣ = 2 g y v\equiv|\boldsymbol v|=\sqrt{2gy} v ≡ ∣ v ∣ = 2 g y ,下落到 A A A 点的用时
T [ y ] = ∫ d x 1 + y ′ 2 2 g y T[y]=\int \mathrm dx \frac{\sqrt{1+y'^2}}{\sqrt{2gy}}
T [ y ] = ∫ d x 2 g y 1 + y ′2
观察到被积函数 L = 1 + y ′ 2 2 g y L=\frac{\sqrt{1+y'^2}}{\sqrt{2gy}} L = 2 g y 1 + y ′2 与 x x x 无关,即式(1.30)的情况
∂ L ∂ f ′ f ′ − L = − 1 2 g y 1 + y ′ 2 = c o n s t \frac{\partial L}{\partial f'}f'-L=-\frac{1}{\sqrt{2gy}\sqrt{1+y'^2}}=const
∂ f ′ ∂ L f ′ − L = − 2 g y 1 + y ′2 1 = co n s t
即 y ( x ) y\left(x\right) y ( x ) 满足
y ( 1 + y ′ 2 ) = c o n s t (1.32) y\left(1+y'^2\right)=const\tag{1.32}
y ( 1 + y ′2 ) = co n s t ( 1.32 )
可以验证式(1.32)有参数方程解,y ( θ ) = a ( 1 − cos θ ) y\left(\theta\right)=a\left(1-\cos\theta\right) y ( θ ) = a ( 1 − cos θ ) 和 x ( θ ) = a ( θ − sin θ ) x\left(\theta\right)=a\left(\theta -\sin \theta\right) x ( θ ) = a ( θ − sin θ ) ,其所描述的曲线即为摆线(cycloid)
1.4.3 多个变量和多元函数
考虑泛函
S = S [ f 1 , f 2 , ⋯ ] = ∫ d t L ( t , f 1 , f 2 , ⋯ , f 1 ′ , f 2 ′ , ⋯ ) (1.33) S=S[f_1,f_2,\cdots]=\int \mathrm dtL\left(t,f_1,f_2,\cdots,f_1',f_2',\cdots\right)\tag{1.33}
S = S [ f 1 , f 2 , ⋯ ] = ∫ d t L ( t , f 1 , f 2 , ⋯ , f 1 ′ , f 2 ′ , ⋯ ) ( 1.33 )
其极值同样要求
δ S = ∫ d t ( δ S δ f 1 δ f 1 + δ S δ f 2 δ f 2 + ⋯ ) = 0 (1.34) \delta S=\int \mathrm dt\left(\frac{\delta S}{\delta f_1}\delta f_1+\frac{\delta S}{\delta f_2}\delta f_2+\cdots\right)=0\tag{1.34}
δ S = ∫ d t ( δ f 1 δ S δ f 1 + δ f 2 δ S δ f 2 + ⋯ ) = 0 ( 1.34 )
因为函数 f 1 , f 2 , ⋯ f_1,f_2,\cdots f 1 , f 2 , ⋯ 相互独立,其变分 δ f 1 , δ f 2 , ⋯ \delta f_1,\delta f_2,\cdots δ f 1 , δ f 2 , ⋯ 也是相互独立的,因此上述式子要求每一项的系数都为零,于是泛函取极值的要求
δ S δ f 1 = 0 , δ S δ f 2 = 0 , ⋯ (1.35) \frac{\delta S}{\delta f_1}=0,\ \frac{\delta S}{\delta f_2}=0,\ \cdots\tag {1.35}
δ f 1 δ S = 0 , δ f 2 δ S = 0 , ⋯ ( 1.35 )
Example 1.5
考虑依赖于两个函数 f ( t ) f\left(t\right) f ( t ) 和 n ( t ) n\left(t\right) n ( t ) 的泛函
S [ f . n ] = ∫ d t 1 2 [ 1 n ( t ) ( f ′ ( t ) ) 2 − n ( t ) ( f ( t ) ) 2 ] S[f.n]=\int \mathrm dt\frac 12\left[\frac{1}{n\left(t\right)}\left(f'\left(t\right)\right)^2-n\left(t\right)\left(f\left(t\right)\right)^2 \right]
S [ f . n ] = ∫ d t 2 1 [ n ( t ) 1 ( f ′ ( t ) ) 2 − n ( t ) ( f ( t ) ) 2 ]
首先对 f ( t ) f\left(t\right) f ( t ) 做变分,得到
δ S = ∫ d t 1 2 ( 1 n 2 f ′ δ f ′ − n 2 f δ f ) ≃ ∫ d t [ − d d t ( f ′ n ) − n f ] δ f \delta S=\int \mathrm dt\frac12\left(\frac{1}{n}2f'\delta f'-n2f\delta f \right)\simeq\int \mathrm dt\left[-\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)-nf \right]\delta f
δ S = ∫ d t 2 1 ( n 1 2 f ′ δ f ′ − n 2 f δ f ) ≃ ∫ d t [ − d t d ( n f ′ ) − n f ] δ f
因此 δ S = 0 \delta S=0 δ S = 0 ,要求
− δ S δ f = d d t ( f ′ n ) + n f = 0 (1.36) -\frac{\delta S}{\delta f}=\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)+nf=0\tag{1.36}
− δ f δ S = d t d ( n f ′ ) + n f = 0 ( 1.36 )
再对 n ( t ) n\left(t\right) n ( t ) 做变分,得到
δ S = ∫ d t 1 2 ( − 1 n 2 f ′ 2 − f 2 ) δ n \delta S=\int \mathrm dt\frac{1}{2}\left(-\frac{1}{n^2}f'^2-f^2\right)\delta n
δ S = ∫ d t 2 1 ( − n 2 1 f ′2 − f 2 ) δ n
因此 δ S = 0 \delta S=0 δ S = 0 ,要求
− δ S δ n = 1 2 n 2 f ′ 2 + 1 2 f 2 (1.37) -\frac{\delta S}{\delta n}=\frac{1}{2n^2}f'^2+\frac12f^2\tag{1.37}
− δ n δ S = 2 n 2 1 f ′2 + 2 1 f 2 ( 1.37 )
泛函 S [ f , n ] S[f,n] S [ f , n ] 取极值的必要条件即 f ( t ) f\left(t\right) f ( t ) 和 n ( t ) n\left(t\right) n ( t ) 满足式(1.36)和(1.37)
泛函中的函数也可以是多元函数,以单个函数 f f f 的泛函 S [ f ] S[f] S [ f ] 为例,设 f f f 为 t t t 和 x x x 的二元函数 f = f ( t , x ) f=f\left(t,x\right) f = f ( t , x ) .简单起见,我们只考虑 L L L 含有 f f f 的一阶导数,泛函具有形式
S = ∬ d t d x L ( t , x , f , ∂ f ∂ t , ∂ f ∂ x ) (1.38) S=\iint \mathrm dt\mathrm dxL\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\tag{1.38}
S = ∬ d t d xL ( t , x , f , ∂ t ∂ f , ∂ x ∂ f ) ( 1.38 )
同样按照之前的步骤,泛函的一阶变分为
δ S = ∬ d t d x δ L ( t , x , f , ∂ f ∂ t , ∂ f ∂ x ) = ∬ d t d x [ ∂ L ∂ f δ f + ∂ L ∂ ( ∂ f ∂ t ) δ ( ∂ f ∂ t ) + ∂ L ∂ ( ∂ f ∂ x ) δ ( ∂ f ∂ x ) ] = ∬ d t d x [ ∂ L ∂ f − ∂ ∂ t ( ∂ L ∂ ( ∂ f ∂ t ) ) − ∂ ∂ x ( ∂ L ∂ ( ∂ f ∂ x ) ) ] δ f \begin{aligned}
\delta S=&\iint \mathrm dt\mathrm dx\delta L\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\\
=&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\delta\left(\frac{\partial f}{\partial t}\right)+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\delta\left(\frac{\partial f}{\partial x}\right) \right]\\
=&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}-
\frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right)
-\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right) \right]\delta f\\
\end{aligned}
δ S = = = ∬ d t d x δ L ( t , x , f , ∂ t ∂ f , ∂ x ∂ f ) ∬ d t d x ∂ f ∂ L δ f + ∂ ( ∂ t ∂ f ) ∂ L δ ( ∂ t ∂ f ) + ∂ ( ∂ x ∂ f ) ∂ L δ ( ∂ x ∂ f ) ∬ d t d x ∂ f ∂ L − ∂ t ∂ ∂ ( ∂ t ∂ f ) ∂ L − ∂ x ∂ ∂ ( ∂ x ∂ f ) ∂ L δ f
所以泛函取极值的必要条件即
δ S δ f = ∂ L ∂ f − ∂ ∂ t ( ∂ L ∂ ( ∂ f ∂ t ) ) − ∂ ∂ x ( ∂ L ∂ ( ∂ f ∂ x ) ) = 0 (1.39) \frac{\delta S}{\delta f}=\frac{\partial L}{\partial f}
-\frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right)
-\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right)=0\tag{1.39}
δ f δ S = ∂ f ∂ L − ∂ t ∂ ∂ ( ∂ t ∂ f ) ∂ L − ∂ x ∂ ∂ ( ∂ x ∂ f ) ∂ L = 0 ( 1.39 )
习题
1.5 考虑一条补课拉伸,质量均匀的柔软喜神,长为 l l l ,质量为 m m m ,细绳两端点悬挂于相同高度,水平距离为 a ( a < l ) a(a<l) a ( a < l ) .
(1) 选择合适的坐标,求细绳总的重力势能 V V V 作为细绳形状的泛函.
(2)求细绳重力势能取极值时,细绳形状所满足的欧拉-拉格朗日方程.
p r o o f proof p roo f
(1) 以细绳的一个端点作为原点,建立坐标系,细绳总的重力势能 V V V 可以写成
V = ∫ 0 a d x 1 + y ′ 2 l m g y = ∫ 0 a d x m g l y 1 + y ′ 2 V=\int_0^a \mathrm dx \frac{\sqrt{1+y'^2}}{l} mgy=\int_0^a \mathrm dx\frac{mg}{l}y\sqrt{1+y'^2}
V = ∫ 0 a d x l 1 + y ′2 m g y = ∫ 0 a d x l m g y 1 + y ′2
(2)做变分
δ V = ∫ 0 a d x m g l ( δ y 1 + y ′ 2 + y y ′ 1 + y ′ 2 δ y ′ ) ≃ ∫ 0 a d x m g l y ′ 2 − y y ′ ′ + 1 ( 1 + y ′ 2 ) 3 / 2 δ y \begin{aligned}
\delta V=&\int_{0}^a \mathrm dx \frac{mg}{l}\left(\delta y\sqrt{1+y'^2}+\frac{yy'}{\sqrt{1+y'^2}}\delta y' \right)\\
\simeq&\int_{0}^a \mathrm dx \frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}\delta y
\end{aligned}
δ V = ≃ ∫ 0 a d x l m g ( δy 1 + y ′2 + 1 + y ′2 y y ′ δ y ′ ) ∫ 0 a d x l m g ( 1 + y ′2 ) 3/2 y ′2 − y y ′′ + 1 δy
因此 δ V = 0 \delta V=0 δ V = 0 ,要求
− δ V δ y = − m g l y ′ 2 − y y ′ ′ + 1 ( 1 + y ′ 2 ) 3 / 2 = 0 -\frac{\delta V}{\delta y}=-\frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}=0
− δy δ V = − l m g ( 1 + y ′2 ) 3/2 y ′2 − y y ′′ + 1 = 0
即细绳形状满足微分方程
y 2 − y y ′ ′ + 1 = 0 y^2-yy''+1=0
y 2 − y y ′′ + 1 = 0
Chapter 2 位形空间
2.1 位形与时间演化
2.1.1 位形
位形 (configuration)即粒子系统中各个粒子的空间位置,或者更一般的物理系统在空间中的形状、分布.位形的概念可以推广至连续系统和非机械系统.
2.1.2 位形空间与流形
系统所有可能位形的集合,就构成位形空间 (configuration space).位形空间中的一点,即代表系统的一种可能的位形.
一般来说,物理系统的位形空间一般不是平坦的线性空间(矢量空间).例如,球面是一个二维空间,但显然不是平坦的.但是,球面局部的一小块,看上去又和二维平面很想,数学上对这种一般的空间的描述,即所谓流形 (manifold)理论.
2.1.3 世界线
随着时间的演化,位形空间中的点在这个空间中也扫出一条连续的曲线,有时被称作时间线 (world line).
2.2 广义坐标
2.2.1 广义坐标的概念
对位形空间的参数化即广义坐标 (generalized coordinates),其是任意一组都能够唯一确定系统某个位形的独立参数.
位置 → 位形 普通空间 → 位形空间 普通坐标 → 广义坐标 \begin{aligned}
位置\quad &\to \quad 位形\\
普通空间 \ &\to\ 位形空间\\
普通坐标 \ &\to\ 广义坐标
\end{aligned}
位置 普通空间 普通坐标 → 位形 → 位形空间 → 广义坐标
Example 2.1 圆环上粒子的位形
如图所示,粒子在固定圆环上无摩擦的自由滑动,粒子在圆环上的角度唯一决定粒子的位置,所以系统具有一个独立的广义坐标即 θ \theta θ .这个系统的位形空间就是圆周,通常记作 S 1 \mathbf{S}^1 S 1 .
Example 2.2 单摆的位形
(a)一个独立广义坐标 θ \theta θ ,位形空间为一维圆周 S 1 \mathbf{S}^1 S 1 .
(b)两个独立广义坐标 x x x 和 θ \theta θ ,位形空间为二维柱面 R 1 × S 1 \mathrm{R}^1\times \mathrm{S}^1 R 1 × S 1 .
(c)球坐标 { θ , ϕ } \{\theta,\phi\} { θ , ϕ } ,位形空间为二维球面 S 2 \mathrm{S}^2 S 2 .
Example 2.3 刚性杆连接两个粒子的位形
系统具有 3 个独立的广义坐标 { x 1 , y 1 , θ } \{x_1,y_1,\theta\} { x 1 , y 1 , θ } ,位形空间为 R 2 × S 1 \mathbf{R}^2\times\mathbf{S}^1 R 2 × S 1 .
Example 2.4 双摆的位移
两个杆的摆角唯一决定了双摆的位形.两个杆的白交 θ 1 \theta_1 θ 1 和 θ 2 \theta_2 θ 2 各自都具有 2 π 2\pi 2 π 的周期性,所以双摆的位形空间是 S 1 × S 1 ≡ T 2 \mathbf{S}^1\times \mathbf{S}^1\equiv \mathbf{T}^2 S 1 × S 1 ≡ T 2 ,其代表二维环面.
物理系统 s s s 个独立的广义坐标
{ q 1 , ⋯ , q s } ≡ q a , a = 1 , 2 , ⋯ , s (2.1) \boxed{\{q^1,\cdots,q^s\}\equiv q^a,\quad a=1,2,\cdots,s}\tag{2.1}
{ q 1 , ⋯ , q s } ≡ q a , a = 1 , 2 , ⋯ , s ( 2.1 )
代表位形空间的一点,即代表系统某个唯一确定的位形,因此,
位形空间的位数 = 独立广义坐标的个数 (2.2) 位形空间的位数=独立广义坐标的个数 \tag{2.2}
位形空间的位数 = 独立广义坐标的个数 ( 2.2 )
2.2.2 广义坐标的变换
现在假设两个广义坐标 { q } \{q\} { q } 和 { q ~ } \{\tilde q\} { q ~ } ,描述同一个位形空间,考虑此位形空间中的任意点 P P P (给定的位形),对应 { q } \{q\} { q } 坐标的数值记作 q ∣ P \left. q\right |_P q ∣ P ,{ q ~ } \{\tilde{q}\} { q ~ } 坐标的数值记作 q ~ ∣ P \left .\tilde{q}\right |_P q ~ ∣ P ,两组坐标的数值满足函数关系
q ~ a ∣ P = f a ( t , q a ∣ P ) , a = 1 , 2 , ⋯ , s (2.3) \left. \tilde {q}^a\right|_P=f^a(t,\left . q^a\right |_P),\quad a=1,2,\cdots,s \tag{2.3}
q ~ a ∣ P = f a ( t , q a ∣ P ) , a = 1 , 2 , ⋯ , s ( 2.3 )
习惯上用 q ~ a \tilde{q}^a q ~ a 本身作为变换的函数名,即
q a → q ~ a = q ~ a ( t , q a ) , a = 1 , 2 , ⋯ , s (2.4) \boxed{q^a\to \tilde q^a=\tilde q^a(t,q^a)},\quad a=1,2,\cdots,s\tag{2.4}
q a → q ~ a = q ~ a ( t , q a ) , a = 1 , 2 , ⋯ , s ( 2.4 )
这种广义坐标之间的变换也叫做点变换(point transformation).我们要求式(2.4)是可逆的,即存在
q ~ a → q a = q a ( t , q ~ a ) (2.5) \tilde q^a\to q^a=q^a(t,\tilde q^a)\tag{2.5}
q ~ a → q a = q a ( t , q ~ a ) ( 2.5 )
也就是说 { q } \{q\} { q } 和 { q ~ a } \{\tilde q^a\} { q ~ a } 是一一对应的.可逆性要求坐标变换的雅可比行列式非零,即
det ( ∂ q ~ a ∂ q a ) ≠ 0 (2.6) \det(\frac{\partial \tilde q^a}{\partial q^a})\neq 0\tag{2.6}
det ( ∂ q a ∂ q ~ a ) = 0 ( 2.6 )
注意 ∂ q ~ b ∂ q a \frac {\partial \tilde q^b}{\partial q^a} ∂ q a ∂ q ~ b 和 ∂ q a ∂ q ~ b \frac{\partial q^a}{\partial \tilde q^b} ∂ q ~ b ∂ q a 满足
∑ b = 1 s ∂ q a ∂ q ~ b ∂ q ~ b ∂ q c = δ a c (2.7) \sum_{b=1}^s\frac{\partial q^a}{\partial \tilde q^b}\frac{\partial \tilde q^b}{\partial q^c}=\delta_{ac}\tag{2.7}
b = 1 ∑ s ∂ q ~ b ∂ q a ∂ q c ∂ q ~ b = δ a c ( 2.7 )
2.3 速度、速度相空间
2.3.1 速度相空间
对于一般的物理系统,从广义坐标 { q } \{q\} { q } 出发,广义速度(generalized velocity)定义为广义坐标的时间导数
v a = d q a ( t ) d t ≡ q ˙ a , a = 1 , 2 , ⋯ , s (2.8) \boxed{v^a=\frac{\mathrm d q^a(t)}{\mathrm dt}\equiv \dot{q}^a},\quad a=1,2,\cdots,s\tag{2.8}
v a = d t d q a ( t ) ≡ q ˙ a , a = 1 , 2 , ⋯ , s ( 2.8 )
物理系统所有可能状态的集合,即状态空间,也被称为相空间(phase space).“坐标”和"速度“构成的状态空间,被称为速度相空间 (velocity space),速度相空间中的一点 { q , q ˙ } \{q,\dot{q}\} { q , q ˙ } 代表系统的一种可能的状态,因此
相空间的位数 = 唯一确定系统演化的独立参数的个数 (2.9) 相空间的位数=唯一确定系统演化的独立参数的个数\tag{2.9}
相空间的位数 = 唯一确定系统演化的独立参数的个数 ( 2.9 )
对于点粒子系统,相空间的位数总是偶数维的,这是因为点粒子系统的运动方程总是需要偶数个初始条件.
2.3.2 广义坐标的变换所诱导的广义速度变换
在式(2.4)的坐标变换下,广义速度的变换为
q ~ ˙ a ≡ d q ~ a d t = ∑ b = 1 s ∂ q ~ a ∂ q b q ˙ b + ∂ q ~ ∂ t ~ (2.10) \dot{\tilde q}^a\equiv\frac{\mathrm d \tilde q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial \tilde q^a}{\partial q^b}\dot q^b+\frac{\partial \tilde q}{\partial \tilde t}\tag{2.10}
q ~ ˙ a ≡ d t d q ~ a = b = 1 ∑ s ∂ q b ∂ q ~ a q ˙ b + ∂ t ~ ∂ q ~ ( 2.10 )
其中 ∂ q ~ a ∂ q b \frac{\partial \tilde q^a}{\partial q^b} ∂ q b ∂ q ~ a 即坐标变换的雅可比矩阵,逆变换即
q a ≡ d q a d t = ∑ b = 1 s ∂ q a ∂ q ~ b q ~ ˙ b + ∂ q ∂ t ~ (2.11) { q}^a\equiv\frac{\mathrm d q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial q^a}{\partial \tilde q^b}\dot {\tilde q}^b+\frac{\partial q}{\partial \tilde t}\tag{2.11}
q a ≡ d t d q a = b = 1 ∑ s ∂ q ~ b ∂ q a q ~ ˙ b + ∂ t ~ ∂ q ( 2.11 )
其中 ∂ q a ∂ q ~ b \frac{\partial q^a}{\partial\tilde q^b} ∂ q ~ b ∂ q a 即 ∂ q ~ a ∂ q b \frac{\partial \tilde q^a}{\partial q^b} ∂ q b ∂ q ~ a 的逆.雅可比行列式 ∂ q a ∂ q ~ b \frac{\partial q^a}{\partial \tilde q^b} ∂ q ~ b ∂ q a 和 ∂ q ~ a ∂ q b \frac{\partial\tilde q^a}{\partial q^b} ∂ q b ∂ q ~ a 都只是广义坐标的函数,因此还可以得到
∂ q ~ a ˙ ∂ q ˙ b = ∂ q ~ a ∂ q b , ∂ q a ˙ ∂ q ~ b ˙ = ∂ q a ∂ q ~ b (2.12) \frac{\partial \dot {\tilde q^a}}{\partial \dot q^b}=\frac{\partial \tilde q^a}{\partial q^b},\quad\frac{\partial \dot {q^a}}{\partial \dot{\tilde q^b}}=\frac{\partial q^a}{\partial \tilde q^b}\tag{2.12}
∂ q ˙ b ∂ q ~ a ˙ = ∂ q b ∂ q ~ a , ∂ q ~ b ˙ ∂ q a ˙ = ∂ q ~ b ∂ q a ( 2.12 )
即广义速度之间的偏导关系等于广义坐标之间的偏导关系.数学上,这正是广义坐标作为逆变矢量在广义坐标变换下的变化关系.
2.4 约束
2.4.1 约束的概念
对系统所能达到的状态(即广义坐标和广义速度)所强加的运动学限制条件即约束 (constraint).这里”运动学“表明约束和相互作用,即和动力学(加速度)没有关系.
约束是对系统状态的限制,也就是对”坐标“和”速度“的限制.当不存在约束时,系统的广义坐标记为 ${q^1,\cdots,q^m} $,则约束的一般数学表达式为
ϕ ( t , q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 (2.13) \phi(t,q^1,\cdots,q^m,\dot{q}^1,\cdots,\dot{q}^m)=0\tag{2.13}
ϕ ( t , q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 ( 2.13 )
2.4.2 约束的分类
定常约束(seleronomous constraint)和非定常约束(rheonomous constraint).约束方程不显含时间,即
ϕ ( q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 (2.14) \phi(q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0\tag{2.14}
ϕ ( q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 ( 2.14 )
为定常约束.需要强调的是,定常约束在另一个有相对运动的参考系中看,则表现为一个非定常约束.但反过来,不是所有的非定常约束都可以通过改变参考系变换为定常约束.
约束最重要的一种分类是所谓的完整约束和非完整约束.约束方程具有形式
ϕ ( t , q 1 , ⋯ , q m ) = 0 (2.15) \phi(t,q^1,\cdots,q^m)=0\tag{2.15}
ϕ ( t , q 1 , ⋯ , q m ) = 0 ( 2.15 )
则被称为完整约束 (holonomic constraint),也叫几何约束,完整约束是对广义坐标之间的约束关系,是对系统”可能位形“的直接限制.完整约束表面有些广义坐标其实是不独立的,可以直接用其他(真正独立的)广义坐标表示出来.如果一个系统的所有约束皆为完整约束,则该系统称为完整系统 (holonomic system).记无约束时系统的广义坐标为 { q 1 , ⋯ , q m } \{q^1,\cdots,q^m\} { q 1 , ⋯ , q m } ,若存在且只存在 k k k 个独立的完整约束
ϕ α ( t , q 1 , ⋯ , q m ) = 0 , α = 1 , ⋯ , k (2.16) \phi_\alpha(t,q_1,\cdots,q^m)=0,\quad \alpha=1,\cdots,k\tag{2.16}
ϕ α ( t , q 1 , ⋯ , q m ) = 0 , α = 1 , ⋯ , k ( 2.16 )
则系统独立的广义坐标数为
s = m − k (2.17) s=m-k\tag{2.17}
s = m − k ( 2.17 )
所有不是完整约束的约束——亦即约束方程无法写成式(2.15)形式的约束即是非完整约束(nonholonomic constraint).非完整约束中最重要的一类式不可积微分约束 (non-integrable differential constraints).所谓微分约束,即约束方程形如
ϕ ( t , q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 (2.18) \phi(t,q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0 \tag{2.18}
ϕ ( t , q 1 , ⋯ , q m , q ˙ 1 , ⋯ , q ˙ m ) = 0 ( 2.18 )
如果一个系统含有未完整约束,即称为非完整系统 (non-holonomic system).
Example 2.10 非完整约束:独轮车
独轮车(unicycle)是最简单的非完整约束的例子。如图所示,半径为 R R R 的轮子,在水平面上做纯滚动(即轮子不打滑)。简单起见,假定轮面和水平面垂直,可用 { x , y , θ , ϕ } \{x,y,\theta,\phi\} { x , y , θ , ϕ } 这 4 个参数描述此系统的位形。满足 2 个约束方程
ϕ 1 ≡ x ˙ − R ϕ ˙ cos θ = 0 , ϕ 2 ≡ y ˙ − R ϕ ˙ sin θ = 0 (2.19) \phi_1\equiv\dot x-R\dot \phi \cos\theta=0,\quad\phi_2\equiv\dot y-R\dot \phi \sin\theta=0\tag{2.19}
ϕ 1 ≡ x ˙ − R ϕ ˙ cos θ = 0 , ϕ 2 ≡ y ˙ − R ϕ ˙ sin θ = 0 ( 2.19 )
这是关于 { x , y , θ , ϕ } \{x,y,\theta,\phi\} { x , y , θ , ϕ } 这 4 个广义坐标的 2 个微分约束。现在证明,式(2.19)中的两个微分约束是不可积的。首先,式(2.19)可以写成
d x − R cos θ d ϕ = 0 , d y − R sin θ d ϕ = 0 (2.20) \mathrm dx-R\cos \theta\mathrm d\phi=0,\quad \mathrm dy-R\sin\theta \mathrm d\phi=0\tag{2.20}
d x − R cos θ d ϕ = 0 , d y − R sin θ d ϕ = 0 ( 2.20 )
数学上可以证明,微分式 F 1 d x 1 + F 2 d x 2 + F 3 d x 3 F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3 F 1 d x 1 + F 2 d x 2 + F 3 d x 3 乘以某个积分因子 λ \lambda λ 后是全微分,亦即存在 Φ \Phi Φ 使得 d Φ = λ ( F 1 d x 1 + F 2 d x 2 + F 3 d x 3 ) \mathrm d\Phi=\lambda(F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3) d Φ = λ ( F 1 d x 1 + F 2 d x 2 + F 3 d x 3 ) 的充分必要条件是
F 1 ( ∂ F 2 ∂ x 3 − ∂ F 3 ∂ x 2 ) + F 2 ( ∂ F 3 ∂ x 1 − ∂ F 1 ∂ x 3 ) + F 3 ( ∂ F 1 ∂ x 2 − ∂ F 2 ∂ x 1 ) = 0 (2.21) F_1\left(\frac{\partial F_2}{\partial x^3}-\frac{\partial F_3}{\partial x^2}\right)+
F_2\left(\frac{\partial F_3}{\partial x^1}-\frac{\partial F_1}{\partial x^3}\right)+
F_3\left(\frac{\partial F_1}{\partial x^2}-\frac{\partial F_2}{\partial x^1}\right)
=0\tag{2.21}
F 1 ( ∂ x 3 ∂ F 2 − ∂ x 2 ∂ F 3 ) + F 2 ( ∂ x 1 ∂ F 3 − ∂ x 3 ∂ F 1 ) + F 3 ( ∂ x 2 ∂ F 1 − ∂ x 1 ∂ F 2 ) = 0 ( 2.21 )
式(2.20)中的两个微分式都不满足,即左边不是全微分。
Example 2.11 非完整约束:两轮车
两轮车的简化模型如图所示,轮子半径为 R R R ,两轮心距离为 l l l ,轮子在水平面上做纯滚动,后轮方向固定,通过前轮转向。简单起见,假设轮面和水平面垂直。为了描述此系统的位形,首先可以确定后轮的位置 { x , y } \{x,y\} { x , y } ,以及后轮的偏向角 ϕ \phi ϕ 和后轮的自转角 α B \alpha _B α B 。这是,前轮的位置也自然确定了,由几何关系得到
x A = x − l sin ϕ , y A = y + l cos ϕ (2.22) x_A=x-l\sin\phi,\quad y_A=y+l\cos\phi\tag{2.22}
x A = x − l sin ϕ , y A = y + l cos ϕ ( 2.22 )
能够调节的还有前轮的转向角 θ \theta θ 和自转角 α A \alpha _A α A 。所以,系统的位形需要用 6 6 6 个参数 { x , y , θ , ϕ , α A , α B } \{x,y,\theta,\phi,\alpha_A,\alpha_B\} { x , y , θ , ϕ , α A , α B } 描述。注意当前轮的转向角 θ \theta θ 固定时,前后轮的运动轨迹是同心圆,圆心 O O O 则是前后轮面垂线的交点。和独轮车一样,列出前后轮的约束。对于后轮
x ˙ = − R α ˙ B sin ϕ , y ˙ = R α ˙ B cos ϕ (2.23) \dot x=-R\dot \alpha_B\sin\phi,\quad \dot y=R\dot \alpha _B\cos\phi\tag{2.23}
x ˙ = − R α ˙ B sin ϕ , y ˙ = R α ˙ B cos ϕ ( 2.23 )
对于前轮
x ˙ − l ϕ ˙ cos ϕ = − R α ˙ A sin ( ϕ + θ ) , y ˙ − l ϕ ˙ sin ϕ = R α ˙ A cos ( ϕ + θ ) (2.24) \dot x-l\dot \phi\cos\phi=-R\dot \alpha _A\sin(\phi+\theta),\quad \dot y-l\dot \phi\sin\phi=R\dot\alpha_A\cos(\phi+\theta)\tag{2.24}
x ˙ − l ϕ ˙ cos ϕ = − R α ˙ A sin ( ϕ + θ ) , y ˙ − l ϕ ˙ sin ϕ = R α ˙ A cos ( ϕ + θ ) ( 2.24 )
由上式重新组合,也可以得到等价的、几何意义更加明显的约束方程
R α ˙ A cos θ = R α ˙ B , R α ˙ A = l cot θ ϕ ˙ (2.25) R\dot \alpha_A\cos\theta=R\dot \alpha_B,\quad R\dot\alpha_A=l\cot \theta\dot \phi\tag{2.25}
R α ˙ A cos θ = R α ˙ B , R α ˙ A = l cot θ ϕ ˙ ( 2.25 )
总之,对于两轮车,6 个广义坐标满足 4 个非完整约束。
2.5 自由度
完整约束直接消除了广义坐标之间的独立性,表明广义坐标之间由约束关系。这种关系即体现在广义坐标之间,也体现在广义坐标的“变分”之间。由约束方程 ϕ ( t , q ) = 0 \phi(t,\mathbf q)=0 ϕ ( t , q ) = 0 变分得到
δ ϕ = ∑ a = 1 m ∂ ϕ ∂ q a δ q a = 0 (2.26) \delta \phi=\sum_{a=1}^m\frac{\partial \phi}{\partial q^a}\delta q^a=0\tag{2.26}
δ ϕ = a = 1 ∑ m ∂ q a ∂ ϕ δ q a = 0 ( 2.26 )
其表面广义坐标不是独立的,满足上面的线性关系。式(2.26)具有非常直观的几何意义,如图所示,一个完整约束可视为位形空间中的一张曲面,系统的位形限制在这张曲面上,因此广义坐标也必然限制在约束面上。式(2.32)中的 ∂ ϕ ∂ q a \frac{\partial \phi}{\partial q^a} ∂ q a ∂ ϕ 即约束面在位形空间中的梯度,即约束面的法向 ∇ ϕ \nabla\phi ∇ ϕ ,式(2.32)正表明广义坐标变分 δ q \delta q δ q 与约束面的法向 ∇ ϕ \nabla \phi ∇ ϕ 正交,即切于约束面。
对于完整系统,一个重要的特征量即独立广义坐标的数目,且每一个完整约束降低一个独立广义坐标变分的数目。而对于非完整约束,约束本身并不能降低独立广义坐标的数目,而只能降低独立广义坐标“变分”的数目。可见,相较于独立广义坐标数目本身,独立广义坐标“变分”的数目更能反映出系统的性质,这就直接导致了自由度 (degrees of freedom)的概念。简言之,自由度等于独立广义坐标变分的数目。需要强调的是,自由度是系统的内禀性质,与具体广义坐标的选取无关。
一个完整约束同时减少一个独立坐标和独立速度分量,一个非完整约束之间少一个独立速度分量。对于非完整约束,广义坐标的个数通常大于真正的自由度。亦即,我们需要额外的变量来参数化其位形,这正体现了非完整系统路径依赖的特性。总之,
完整系统:自由度 = 广义坐标个数 非完整系统:自由度 < 广义坐标个数 \begin{aligned}
完整系统:自由度&=广义坐标个数\\
非完整系统:自由度 &\lt 广义坐标个数
\end{aligned}
完整系统:自由度 非完整系统:自由度 = 广义坐标个数 < 广义坐标个数
物理系统的时间演化由微分方程描述,从微分方程定解的角度,问题可以归结为我们需要知道多少个独立的初始条件,才能确定一组定解。或者说,我们由多少个独立参数,可以用以调节从而得到系统的不同演化。这一问题也被称作柯西初值问题 (Cauchy initial value problem)。对于自然界常见的系统,约定每 1 个自由度的演化由其广义坐标和广义速度(即状态)的初值,即 2 个参数决定。在这个意义上,自由度可以等价地定义为
自由度 = 1 2 ⋅ 唯一确定系统状态的独立参数个数 = 1 2 ⋅ 唯一确定系统演化的初始条件的个数 = 1 2 ⋅ 相空间的位数 (2.34) \begin{aligned}
自由度 &=\frac 12\cdot唯一确定系统状态的独立参数个数\\
&=\frac 12\cdot唯一确定系统演化的初始条件的个数\\
&=\frac 12 \cdot 相空间的位数
\end{aligned}
\tag{2.34}
自由度 = 2 1 ⋅ 唯一确定系统状态的独立参数个数 = 2 1 ⋅ 唯一确定系统演化的初始条件的个数 = 2 1 ⋅ 相空间的位数 ( 2.34 )
对于点粒子系统,相空间的维数总是偶数,于是保证了自由度都是整数。
Chapter 3 相对论时空观
力学研究物理系统的时间演化。物理系统的韵达规律总是在某个时空背景上加以描述,所以力学的首要问题即是时空观 (view on space and time),即对于时间和空间的基本观念。
3.1 时空的基本概念
3.1.1 时空
时间的一瞬和空间的一点的联合就给定了一个“时空点”,记作 p p p 。对于任何一个时空点 p p p ,我们都可以用 4 4 4 个实数(c c c 为光速)
{ c t , x , y , z } ≡ { x 0 , x 1 , x 2 , x 3 } ≡ { x μ } , μ = 0 , 1 , 2 , 3 (3.1) \{ct,x,y,z\}\equiv \{x^0,x^1,x^2,x^3\} \equiv\{x^{\mu}\},\quad\mu=0,1,2,3 \tag{3.1}
{ c t , x , y , z } ≡ { x 0 , x 1 , x 2 , x 3 } ≡ { x μ } , μ = 0 , 1 , 2 , 3 ( 3.1 )
来对其参数化。全体时空点的集合即时空 (spacetime)。
3.2 度规
3.2.1 度规
记空间坐标为 { q a } \{q^a\} { q a } ,则无穷小距离的平方可以表示成坐标微分 { d q a } \{\mathrm d q^a\} { d q a } 的二次型。这个无穷小距离的平方被称作线元 (line element),通常记作 d s 2 \mathrm d s^2 d s 2 ,写成矩阵的形式即
d s 2 = ( d q 1 ⋯ d q s ) ( g 11 ⋯ g 1 s ⋮ ⋱ ⋮ g s 1 ⋯ g s s ) ( d q 1 ⋮ d q s ) (3.2) \mathrm d s^2=
\begin{pmatrix}
\mathrm dq^1 & \cdots & \mathrm dq^s
\end{pmatrix}
\begin{pmatrix}
g_{11}& \cdots & g_{1s} \\
\vdots & \ddots & \vdots \\
g_{s1} & \cdots & g_{ss}
\end{pmatrix}
\begin{pmatrix}
\mathrm dq^1\\
\vdots \\
\mathrm d q^s
\end{pmatrix}
\tag {3.2}
d s 2 = ( d q 1 ⋯ d q s ) g 11 ⋮ g s 1 ⋯ ⋱ ⋯ g 1 s ⋮ g ss d q 1 ⋮ d q s ( 3.2 )
这里由二次型的系数构成的对称矩阵 g a b g_{ab} g ab 被称作度规 (metric)。
3.2.2 一些典型空间的度规
2 维欧氏空间的线元可以写成
d s 2 = ∑ i = 1 2 ∑ j = 1 2 δ i j d x i d x j , δ i , j = ( 1 0 0 1 ) , i , j = 1 , 2 (3.3) \mathrm ds^2=\sum_{i=1}^2\sum_{j=1}^2 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}=
\begin{pmatrix}
1 & 0\\
0 & 1
\end{pmatrix}
}
,\quad i,j=1,2 \tag{3.3}
d s 2 = i = 1 ∑ 2 j = 1 ∑ 2 δ ij d x i d x j , δ i , j = ( 1 0 0 1 ) , i , j = 1 , 2 ( 3.3 )
极坐标 { r , ϕ } \{r,\phi\} { r , ϕ }
d s 2 = ∑ i = 1 2 ∑ j = 1 2 g i j d x i d x j , g i , j = ( 1 0 0 r 2 ) , i , j = r , ϕ (3.4) \mathrm d s^2=\sum_{i=1}^2\sum_{j=1}^2 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}=
\begin{pmatrix}
1 & 0\\
0 & r^2
\end{pmatrix}},
\quad i,j=r,\phi
\tag{3.4}
d s 2 = i = 1 ∑ 2 j = 1 ∑ 2 g ij d x i d x j , g i , j = ( 1 0 0 r 2 ) , i , j = r , ϕ ( 3.4 )
3 维欧氏空间
d s 2 = ∑ i = 1 3 ∑ j = 1 3 δ i j d x i d x j , δ i , j = ( 1 0 0 0 1 0 0 0 1 ) , i , j = 1 , 2 , 3 (3.5) \mathrm ds^2=\sum_{i=1}^3\sum_{j=1}^3 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}=
\begin{pmatrix}
1 & 0 & 0\\
0 & 1 & 0\\
0 & 0 & 1
\end{pmatrix}
}
,\quad i,j=1,2,3 \tag{3.5}
d s 2 = i = 1 ∑ 3 j = 1 ∑ 3 δ ij d x i d x j , δ i , j = 1 0 0 0 1 0 0 0 1 , i , j = 1 , 2 , 3 ( 3.5 )
球坐标 { r , ϕ , θ } \{r,\phi,\theta\} { r , ϕ , θ }
d s 2 = ∑ i = 1 3 ∑ j = 1 3 g i j d x i d x j , g i , j = ( 1 0 0 0 r 2 0 0 0 r 2 sin 2 θ ) , i , j = r , ϕ , θ (3.6) \mathrm d s^2=\sum_{i=1}^3\sum_{j=1}^3 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}=
\begin{pmatrix}
1 & 0 & 0\\
0 & r^2 & 0\\
0 & 0 & r^2\sin^2 \theta
\end{pmatrix}},
\quad i,j=r,\phi,\theta
\tag{3.6}
d s 2 = i = 1 ∑ 3 j = 1 ∑ 3 g ij d x i d x j , g i , j = 1 0 0 0 r 2 0 0 0 r 2 sin 2 θ , i , j = r , ϕ , θ ( 3.6 )
3.2.3 度规的一般定义
当选取某个做坐标 { q a } \{q^a\} { q a } 时,空间中的线元总是可以表达成坐标微分 { d q a } \{\mathrm d q^a\} { d q a } 的二次型:
d s 2 = ∑ a = 1 D ∑ b = 1 D g a b d q a d q b (3.7) \mathrm d s^2=\sum_{a=1}^D\sum_{b=1}^D g_{ab}\mathrm dq^a\mathrm dq^b\tag{3.7}
d s 2 = a = 1 ∑ D b = 1 ∑ D g ab d q a d q b ( 3.7 )
这里 D D D 表示空间的维数;g a b g_{ab} g ab 即度规,是非退化的即 det g a b ≠ 0 \det g_{ab} \neq 0 det g ab = 0 ,且是对称的 g a b = g b a g_{ab}=g_{ba} g ab = g ba 。采用爱因斯坦求和约定 (Einstein summation convention),线元通常写成
d s 2 = g a b d q a d q b (3.8) \boxed{\mathrm d s^2=g_{ab}\mathrm dq^a\mathrm d q^b} \tag{3.8}
d s 2 = g ab d q a d q b ( 3.8 )
规定逆度规 (inverse metric)
g a b : = ( g − 1 ) a b (3.9) \boxed{g^{ab}:=(g^{-1})_{ab}}\tag{3.9}
g ab := ( g − 1 ) ab ( 3.9 )
3.2.4 时空的度规
爱因斯坦狭义相对论的时空背景是所谓闵可夫斯基时空 (Minkowski spacetime),简称闵氏时空,取直角坐标
{ x μ } = { x 0 , x 1 , x 2 , x 3 } = { c t , x , y , z } (3.10) \{x^\mu\}=\{x^0,x^1,x^2,x^3\}=\{ct,x,y,z\} \tag{3.10}
{ x μ } = { x 0 , x 1 , x 2 , x 3 } = { c t , x , y , z } ( 3.10 )
闵氏时空的线元为
d s 2 = − c 2 ( d t ) 2 + ( d x ) 2 + ( d y ) 2 + ( d z ) 2 ≡ η μ ν d x μ d x ν (3.11) \mathrm d s^2=-c^2(\mathrm dt)^2+(\mathrm dx)^2+(\mathrm dy)^2+(\mathrm dz)^2\equiv\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu\tag{3.11}
d s 2 = − c 2 ( d t ) 2 + ( d x ) 2 + ( d y ) 2 + ( d z ) 2 ≡ η μν d x μ d x ν ( 3.11 )
因此闵氏时空的度规和逆度规分别为
η μ ν = ( − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ) , η μ ν = ( − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ) (3.12) \eta_{\mu\nu}=
\begin{pmatrix}
-1 & 0 & 0 &0\\
0 & 1 & 0 &0\\
0 & 0 & 1 & 0\\
0 & 0 &0 & 1
\end{pmatrix},\quad
\eta^{\mu\nu}=
\begin{pmatrix}
-1 & 0 & 0 &0\\
0 & 1 & 0 &0\\
0 & 0 & 1 & 0\\
0 & 0 &0 & 1
\end{pmatrix}\tag{3.12}
η μν = − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 , η μν = − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ( 3.12 )
对于一个一般的时空北京,度规可以写成
d s 2 = g μ ν d x μ d x ν (3.24) \mathrm ds^2=g_{\mu\nu}\mathrm d x^\mu\mathrm dx^\nu \tag{3.24}
d s 2 = g μν d x μ d x ν ( 3.24 )
3.2.5 逆变和协变
在矢量或张量上方的指标被称为上标 (upper index)或逆变指标 (contravariant index),在下方的指标被称为下标 (lower index)或协变指标 (covariant index)。相应地,带上标的矢量(例如广义速度 q a ˙ \dot{q^a} q a ˙ )被称为逆变矢量 (contravariant vector),带下标的矢量(例如梯度 ∇ a f \nabla _a f ∇ a f )被称为协变矢量 (covariant vector)。
Chapter 4 最小作用量原理
4.2 作用量
作用量 (action)
S [ q ] = ∫ t 1 t 2 d t L ( t , q , q ˙ ) (4.1) S[q]=\int_{t_1}^{t_2}\mathrm dtL(t,q,\dot{q}) \tag{4.1}
S [ q ] = ∫ t 1 t 2 d t L ( t , q , q ˙ ) ( 4.1 )
最小作用量原理 (principle of least action)
δ S = 0 (4.2) \delta S =0\tag{4.2}
δ S = 0 ( 4.2 )
4.2.2 广义动量
物理系统某个广义坐标 q a q^a q a 对于的广义动量 (generalized momentum)定义为
p a : = ∂ L ∂ q a ˙ ≡ ∂ L ∂ v a , a = 1 , ⋯ , s (4.3) \boxed{p_a:=\frac{\partial L}{\partial \dot{q^a}}\equiv\frac{\partial L}{\partial v^a}},\quad a=1,\cdots,s\tag{4.3}
p a := ∂ q a ˙ ∂ L ≡ ∂ v a ∂ L , a = 1 , ⋯ , s ( 4.3 )
广义坐标 q a q^a q a 及其对应的广义动量 p a p_a p a 构成一对共轭变量 { q a , p a } \{q^a,p_a\} { q a , p a } ,因此式(4.3)定义的广义动量又被称为共轭动量 (conjugate momentum)或正则动量 (canonical momentum)。
4.3 自由粒子
4.3.1 4 维形式
自由粒子的作用量最简单的取法即时间线的长度
S = − m c ∫ ∣ d s ∣ = − m c ∫ − η μ ν d x μ d x ν (4.4) S=-mc\int|\mathrm ds|=-mc\int \sqrt{-\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu}\tag{4.4}
S = − m c ∫ ∣ d s ∣ = − m c ∫ − η μν d x μ d x ν ( 4.4 )
原则上可以用任一单调变化的参数来参数化世界线。最简单和自然的参数化即取固有时 τ \tau τ
d s 2 = η μ ν d x μ d x ν ≡ − c 2 d τ 2 (4.5) \mathrm ds^2=\eta_{\mu\nu}\mathrm dx^{\mu}\mathrm dx^{\nu}\equiv -c^2\mathrm d \tau^2\tag{4.5}
d s 2 = η μν d x μ d x ν ≡ − c 2 d τ 2 ( 4.5 )
因此自由粒子的作用量式(4.4)还可以写成
S = − m c ∫ d τ − η μ ν d x μ d τ d x ν d τ (4.6) S=-mc\int \mathrm d\tau\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}} \tag{4.6}
S = − m c ∫ d τ − η μν d τ d x μ d τ d x ν ( 4.6 )
粒子的时空坐标 x μ x^\mu x μ 随固有时 τ \tau τ 的变化率被称为 4-速度 (4-velocity)
u μ : = d x μ ( τ ) d τ (4.7) u^\mu:=\frac{\mathrm dx^\mu(\tau)}{\mathrm d\tau} \tag{4.7}
u μ := d τ d x μ ( τ ) ( 4.7 )
其实 4 维时空中的矢量。由式(4.5)
u μ u μ ≡ η μ ν d x μ d τ d x ν d τ = − c 2 (4.8) u_\mu u^\mu\equiv\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm dx^\nu}{\mathrm d\tau}=-c^2 \tag{4.8}
u μ u μ ≡ η μν d τ d x μ d τ d x ν = − c 2 ( 4.8 )
即粒子的 4-速度 u μ u^\mu u μ 的模方是常数 − c 2 -c^2 − c 2 。
将式(4.6)对 x μ x^\mu x μ 求变分,并利用式(4.8),得到
δ S = − m c ∫ d τ δ − η μ ν d x μ d τ d x ν d τ = m ∫ d τ η μ ν δ ( d x μ d τ ) d x ν d τ ≃ − m ∫ d τ η μ ν d 2 x ν d τ 2 δ x μ (4.8) \begin{aligned}
\delta S&=-mc\int \mathrm d\tau\delta \sqrt{-\eta_{\mu\nu}\frac{\mathrm d x^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}=m\int\mathrm d\tau \eta_{\mu\nu}\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\\
&\simeq -m\int\mathrm d\tau \eta_{\mu\nu} \frac{\mathrm d^2 x^\nu}{\mathrm d\tau^2}\delta x^\mu
\end{aligned}
\tag{4.8}
δ S = − m c ∫ d τ δ − η μν d τ d x μ d τ d x ν = m ∫ d τ η μν δ ( d τ d x μ ) d τ d x ν ≃ − m ∫ d τ η μν d τ 2 d 2 x ν δ x μ ( 4.8 )
所以粒子的自由运动方程为
d 2 x ν d τ 2 = 0 (4.9) \frac{\mathrm d^2 x^\nu}{\mathrm d \tau^2}=0 \tag{4.9}
d τ 2 d 2 x ν = 0 ( 4.9 )
引入 4-速度后,自由粒子的作用量式(4.6)可以写成 S = ∫ d τ L S=\int \mathrm d\tau L S = ∫ d τL ,这里 L = − m c − η μ ν u μ u ν L=-mc\sqrt{-\eta_{\mu\nu}u^\mu u^\nu} L = − m c − η μν u μ u ν ,粒子的 4-动量为
p μ : = ∂ L ∂ u μ = ∂ ∂ u μ ( − m c − η ρ σ u ρ u σ ) = m u μ (4.10) p_\mu:=\frac{\partial L}{\partial u^\mu}=\frac{\partial}{\partial u^\mu}(-mc\sqrt{-\eta_{\rho\sigma}u^\rho u^\sigma})=mu_\mu\tag{4.10}
p μ := ∂ u μ ∂ L = ∂ u μ ∂ ( − m c − η ρ σ u ρ u σ ) = m u μ ( 4.10 )
4.3.2 3 维形式
式(4.4)可以写成
S = − m c ∫ c 2 ( d t ) 2 − δ i j d x i d x j = − m c 2 ∫ d t 1 − 1 c 2 δ i j d x i d t d x j d t (4.11) S=-mc\int\sqrt{c^2(\mathrm dt)^2-\delta_{ij}\mathrm dx^i\mathrm dx^j}=-mc^2\int \mathrm dt\sqrt{1-\frac{1}{c^2}\delta_{ij}\frac{\mathrm dx^i}{\mathrm d t}\frac{\mathrm dx^j}{\mathrm dt}} \tag{4.11}
S = − m c ∫ c 2 ( d t ) 2 − δ ij d x i d x j = − m c 2 ∫ d t 1 − c 2 1 δ ij d t d x i d t d x j ( 4.11 )
其中出现了粒子空间坐标 { x i } \{x^i\} { x i } 随着时间参数 t t t 的变化率
v i : = d x i d t , i = 1 , 2 , 3 (4.12) v^i:=\frac{\mathrm dx^i}{\mathrm dt},\quad i=1,2,3 \tag{4.12}
v i := d t d x i , i = 1 , 2 , 3 ( 4.12 )
即通常所说的”速度“,也被称作 3-速度 (3-velocity),为 3 维空间中的矢量。于是作用量式(4.4)称为
S = ∫ d t L , L = − m c 2 1 − v 2 c 2 (4.13) S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}} \tag{4.13}
S = ∫ d t L , L = − m c 2 1 − c 2 v 2 ( 4.13 )
其中 v 2 ≡ δ i j v i v j v^2\equiv \delta_{ij}v^iv^j v 2 ≡ δ ij v i v j ,式(4.13)就是闵氏时空中自由粒子作用量的 3 维形式。这里自然地出现了著名的洛伦兹因子 (Lorentz factor)
d t d τ = 1 1 − v 2 c 2 ≡ γ (4.14) \frac{\mathrm dt}{\mathrm d\tau}=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}\equiv\gamma \tag{4.14}
d τ d t = 1 − c 2 v 2 1 ≡ γ ( 4.14 )
同时可以得到 3-动量
p i ≡ ∂ L ∂ v i = ∂ ∂ v i ( − m c 2 1 − v 2 c 2 ) = m v i 1 − v 2 c 2 , i = 1 , 2 , 3 (4.15) p_i\equiv\frac{\partial L}{\partial v^i}=\frac{\partial}{\partial v^i}\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}\right)=\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.15},\quad i=1,2,3
p i ≡ ∂ v i ∂ L = ∂ v i ∂ ( − m c 2 1 − c 2 v 2 ) = 1 − c 2 v 2 m v i , i = 1 , 2 , 3 ( 4.15 )
这里 v i = δ i j v j v_i=\delta_{ij} v^j v i = δ ij v j 。利用式(4.14)及 3-速度的定义, 3-动力还可以写成
p i = m d x i d t d t d τ = m d x i d τ ≡ m u i , i = 1 , 2 , 3 (4.16) p_i=m\frac{\mathrm dx_i}{\mathrm dt}\frac{\mathrm dt}{\mathrm d\tau}=m\frac{\mathrm dx_i}{\mathrm d\tau}\equiv mu_i,\quad i=1,2,3 \tag{4.16}
p i = m d t d x i d τ d t = m d τ d x i ≡ m u i , i = 1 , 2 , 3 ( 4.16 )
可见 3-动量对应空间坐标对于固有时 τ \tau τ 的变化率(4-速度的空间分量)。牛顿力学中的动量 m v i mv_i m v i 只是严格的 3-动量在非相对论极限下的近似。
对于时间分量,定义
E : = c p 0 = m c u 0 = m c 2 d t d τ = − m c 2 1 − v 2 c 2 (4.17) E:=cp^0=mcu^0=mc^2\frac{\mathrm dt}{\mathrm d\tau}=-\frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.17}
E := c p 0 = m c u 0 = m c 2 d τ d t = − 1 − c 2 v 2 m c 2 ( 4.17 )
为粒子的能量。于是 4-动量的模方可以分解为
p μ p μ = − ( p 0 ) 2 + δ i j p i p j ≡ − E 2 c 2 + p 2 (4.18) p_\mu p^\mu=-(p^0)^2+\delta_{ij}p^ip^j\equiv -\frac{E^2}{c^2}+p^2\tag{4.18}
p μ p μ = − ( p 0 ) 2 + δ ij p i p j ≡ − c 2 E 2 + p 2 ( 4.18 )
这里 p 2 = δ i j p i p j p^2=\delta_{ij}p^ip^j p 2 = δ ij p i p j 。而由式(4.8)得,4-动量的模方是常数
p μ p μ = m 2 u μ u μ = − m 2 c 2 (4.19) p_\mu p^\mu=m^2u_\mu u^\mu=-m^2c^2\tag{4.19}
p μ p μ = m 2 u μ u μ = − m 2 c 2 ( 4.19 )
即给出
E 2 = p 2 c 2 + m 2 c 4 (4.20) E^2=p^2c^2+m^2c^4\tag{4.20}
E 2 = p 2 c 2 + m 2 c 4 ( 4.20 )
这就是著名的爱因斯坦能量-动量关系 (energy-momentum relation)。
4.4 外场中的粒子
4.4.1 标量场
考虑闵氏时空标量场中的粒子。标量场对粒子的影响可以有各种方式,我们考虑最简单的情形,即使得线元长度发生变化 $|\mathrm ds|\rightarrow e^\Phi|\mathrm ds| $,因此作用量为
S = − m c ∫ e Φ ∣ d s ∣ = − m c ∫ d τ e Φ − u μ u μ (4.21) S=-mc\int e^\Phi|\mathrm ds|=-mc\int \mathrm d\tau e^\Phi\sqrt{-u_\mu u^\mu} \tag{4.21}
S = − m c ∫ e Φ ∣ d s ∣ = − m c ∫ d τ e Φ − u μ u μ ( 4.21 )
其中 Φ = Φ ( t , x ) ≡ Φ ( x ) \Phi=\Phi(t,x)\equiv \Phi(x) Φ = Φ ( t , x ) ≡ Φ ( x ) 是无量纲的标量场,u μ u^\mu u μ 为 4-速度式。对作用量式(4.21)对时空坐标 x μ x^\mu x μ 求变分得到运动方程
d 2 x μ d τ 2 + ∂ Φ ∂ x ν ∂ x ν ∂ τ d x μ d τ + c 2 ∂ Φ ∂ x μ = 0 , μ = 0 , 1 , 2 , 3 (4.22) \frac{\mathrm d^2x_\mu}{\mathrm d\tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx_\mu}{\mathrm d\tau}+c^2\frac{\partial \Phi}{\partial x^\mu}=0,\quad \mu=0,1,2,3\tag{4.22}
d τ 2 d 2 x μ + ∂ x ν ∂ Φ ∂ τ ∂ x ν d τ d x μ + c 2 ∂ x μ ∂ Φ = 0 , μ = 0 , 1 , 2 , 3 ( 4.22 )
推导
δ S = − m c ∫ d τ δ ( e Φ − η μ ν d x μ d τ d x ν d τ ) = m ∫ d τ [ − c 2 e Φ ∂ Φ ∂ x μ δ x μ + e Φ δ ( d x μ d τ ) d x ν d τ ] ≃ − m ∫ d τ [ d d τ ( e Φ d x ν d τ ) + c 2 e Φ ∂ Φ ∂ x μ ] δ x μ = − m ∫ d τ e Φ ( d 2 x μ d τ 2 + ∂ Φ ∂ x ν ∂ x ν ∂ τ d x μ d τ + c 2 d Φ ∂ x μ ) δ x μ \begin{aligned}
\delta S&=-mc\int\mathrm d\tau \delta\left(e^\Phi\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}\right)\\
&=m\int\mathrm d\tau\left[-c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\delta x^\mu +e^\Phi\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\right]\\
&\simeq -m\int \mathrm d\tau\left[\frac{\mathrm d}{\mathrm d\tau}\left(e^\Phi\frac{\mathrm d x^\nu}{\mathrm d\tau} \right)+ c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\right]\delta x^\mu\\
&=-m\int\mathrm d\tau e^\Phi\left(\frac{\mathrm d^2 x^\mu}{\mathrm d \tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx^\mu}{\mathrm d\tau}+c^2\frac{\mathrm d\Phi}{\partial x^\mu } \right)\delta x^\mu
\end{aligned}
δ S = − m c ∫ d τ δ ( e Φ − η μν d τ d x μ d τ d x ν ) = m ∫ d τ [ − c 2 e Φ ∂ x μ ∂ Φ δ x μ + e Φ δ ( d τ d x μ ) d τ d x ν ] ≃ − m ∫ d τ [ d τ d ( e Φ d τ d x ν ) + c 2 e Φ ∂ x μ ∂ Φ ] δ x μ = − m ∫ d τ e Φ ( d τ 2 d 2 x μ + ∂ x ν ∂ Φ ∂ τ ∂ x ν d τ d x μ + c 2 ∂ x μ d Φ ) δ x μ
类似地,作用量式(4.38)的 3 维形式为
S = − m c 2 ∫ d t e Φ 1 − v 2 c 2 (4.23) S=-mc^2\int \mathrm dte^\Phi\sqrt{1-\frac{v^2}{c^2}}\tag{4.23}
S = − m c 2 ∫ d t e Φ 1 − c 2 v 2 ( 4.23 )
将其对空间坐标 x i x^i x i 变分即得到运动方程的 3 维形式
p i ˙ + Φ ˙ p i + m c 2 1 − v 2 c 2 ∂ Φ ∂ x i = 0 , i = 1 , 2 , 3 (4.24) \dot{p_i}+\dot{\Phi}p_i+mc^2\sqrt{1-\frac{v^2}{c^2}}\frac{\partial \Phi}{\partial x^i}=0,\quad i=1,2,3\tag{4.24}
p i ˙ + Φ ˙ p i + m c 2 1 − c 2 v 2 ∂ x i ∂ Φ = 0 , i = 1 , 2 , 3 ( 4.24 )
在有外场存在的情况下,我们同时考虑“低速”和“弱场”的极限,即
∣ v ∣ c ≪ 1 , ∣ Φ ∣ ≡ ∣ V ∣ m c 2 ≪ 1 (4.25) \frac{|v|}{c}\ll1,\quad|\Phi|\equiv\frac{|V|}{mc^2}\ll1\tag{4.25}
c ∣ v ∣ ≪ 1 , ∣Φ∣ ≡ m c 2 ∣ V ∣ ≪ 1 ( 4.25 )
其中 V V V 具有能量量纲。因为 ∣ V ∣ ≪ m c 2 |V|\ll mc^2 ∣ V ∣ ≪ m c 2 的意义是与外场相互作用的能量远远小于粒子的静止能量 m c 2 mc^2 m c 2 。因此上面的极限也可以统称为非相对论极限。在非相对论极限下,运动方程式(4.24)展开并保留至速度 v v v 和 V V V 的领头阶 为
m x i ¨ = − ∂ V ∂ x i (4.26) m\ddot{x_i}=-\frac{\partial V}{\partial x^i} \tag{4.26}
m x i ¨ = − ∂ x i ∂ V ( 4.26 )
其中右边 − ∂ V ∂ x i -\frac{\partial V}{\partial x^i} − ∂ x i ∂ V 是 V V V 的空间梯度,正是牛顿力学中保守力的形式。这表明在非相对论极限下, $V $ 具有牛顿力学中势能的意义。另一方面,作用量的 3 维形式(4.23)也可展开并保留领头阶,得到
S = − m c 2 ∫ d t e V m c 2 1 − v 2 c 2 = − m c 2 ∫ d t ( 1 + V m c 2 + ⋯ ) ( 1 − 1 2 v 2 c 2 + ⋯ ) = − ∫ d t m c 2 + ∫ d t ( 1 2 m v 2 − V ) + ⋯ (4.27) \begin{aligned}
S&=-mc^2\int \mathrm dt e^{\frac{V}{mc^2}}\sqrt{1-\frac{v^2}{c^2}}=-mc^2\int\mathrm dt(1+\frac{V}{mc^2}+\cdots)(1-\frac{1}{2}\frac{v^2}{c^2}+\cdots)\\
&=-\int \mathrm dt mc^2+\int \mathrm dt\left (\frac12mv^2-V\right)+ \cdots
\end{aligned}
\tag{4.27}
S = − m c 2 ∫ d t e m c 2 V 1 − c 2 v 2 = − m c 2 ∫ d t ( 1 + m c 2 V + ⋯ ) ( 1 − 2 1 c 2 v 2 + ⋯ ) = − ∫ d t m c 2 + ∫ d t ( 2 1 m v 2 − V ) + ⋯ ( 4.27 )
除去常数项,在非相对论极限下,拉格朗日量在与速度和外场有关的领头阶具有“动能减去势能”的形式:
L = 1 2 m v 2 − V ≡ T − V (4.28) L=\frac{1}{2}mv^2-V\equiv T-V \tag{4.28}
L = 2 1 m v 2 − V ≡ T − V ( 4.28 )
其中 T = 1 2 m v 2 T=\frac 12 mv^2 T = 2 1 m v 2 即牛顿力学的动能,V V V 在非相对论极限下对于牛顿力学的势能。从展开的过程可以看出,这里“减号”的来源正是闵氏时空度规中时间和空间部分的符号差异。
4.4.2 电磁场
接下来考虑粒子与 4 维矢量场 A μ A^\mu A μ 的相互作用,最熟悉的矢量场即电磁场。考虑闵氏时空,作用量必须是洛伦兹标量。因此,问题转化为如何用矢量场和粒子的世界线来构造一个标量,最简单的方式就是矢量场与粒子 4-速度的内积 A μ u μ A_\mu u^\mu A μ u μ ,将这个标量沿着粒子的世界线积分,自然仍然是一个标量。于是,矢量场对粒子的作用量贡献为
∫ d τ A μ u μ = ∫ d τ A μ d x μ d τ = ∫ A μ d x μ (4.29) \int \mathrm d\tau A_\mu u^\mu=\int \mathrm d\tau A_\mu \frac{\mathrm dx^\mu}{\mathrm d\tau}=\int A_\mu \mathrm dx^\mu \tag{4.29}
∫ d τ A μ u μ = ∫ d τ A μ d τ d x μ = ∫ A μ d x μ ( 4.29 )
矢量场中粒子的完整作用量即
S = ∫ d τ L , L = − m c − u μ u μ + e c A μ u μ (4.30) \boxed{S=\int \mathrm d\tau L,\quad L=-mc\sqrt{-u_\mu u^\mu}+\frac{e}{c}A_\mu u^\mu }
\tag{4.30}
S = ∫ d τL , L = − m c − u μ u μ + c e A μ u μ ( 4.30 )
这里常数 e e e 代表了粒子与矢量场 A μ A_\mu A μ 的耦合强度。对于电磁场,e e e 即粒子的电荷。
电磁场对粒子运动方程的贡献来源于对第二项的变分。有
δ ∫ d τ A μ u μ = ∫ d τ ( ∂ A μ ∂ x ν δ x ν u μ + A μ δ ( d x μ d τ ) ) ≃ ∫ d τ ( ∂ A μ ∂ x ν u μ δ x ν − ∂ A μ ∂ x ν u ν δ x μ ) ≡ ∫ d τ F μ ν u ν δ x μ \begin{aligned}
\delta\int \mathrm d\tau A_\mu u^\mu &=\int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}\delta x^\nu u^\mu+A_\mu\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau} \right) \right)\\
&\simeq \int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}u^\mu\delta x^\nu-\frac{\partial A_\mu}{\partial x^\nu}u^\nu\delta x^\mu \right)\equiv\int \mathrm d\tau F_{\mu\nu}u^\nu \delta x^\mu
\end{aligned}
δ ∫ d τ A μ u μ = ∫ d τ ( ∂ x ν ∂ A μ δ x ν u μ + A μ δ ( d τ d x μ ) ) ≃ ∫ d τ ( ∂ x ν ∂ A μ u μ δ x ν − ∂ x ν ∂ A μ u ν δ x μ ) ≡ ∫ d τ F μν u ν δ x μ
其中
F μ ν : = ∂ A ν ∂ x μ − ∂ A μ ∂ x ν (4.31) \boxed{F_{\mu\nu}:=\frac{\partial A_\nu}{\partial x_\mu}-\frac{\partial A_\mu}{\partial x_\nu}}
\tag{4.31}
F μν := ∂ x μ ∂ A ν − ∂ x ν ∂ A μ ( 4.31 )
被称为电磁张量 (electromagnetic tensor)或电磁场强。由定义可知 F μ ν F_{\mu\nu} F μν 是一个反对称的张量,即 F μ ν = − F ν μ F_{\mu\nu}=-F_{\nu\mu} F μν = − F νμ 。结合自由粒子作用量的变分式,最终得到电磁场中粒子的运动方程为
d p μ d τ = e c F μ ν u ν (4.32) \frac{\mathrm d p_\mu}{\mathrm d\tau}=\frac{e}{c}F_{\mu\nu}u^\nu \tag{4.32}
d τ d p μ = c e F μν u ν ( 4.32 )
4-矢量 A μ A^\mu A μ 可以分解为
A μ = ( A 0 , A i ) ≡ ( Φ , A ) (4.33) A^\mu=(A^0,A^i)\equiv(\Phi,A) \tag{4.33}
A μ = ( A 0 , A i ) ≡ ( Φ , A ) ( 4.33 )
其中 Φ \Phi Φ 被称为标量势(scalar potential),A A A 被称为矢量势 (vector potential)。这里的所谓“标量”和“矢量“都是指 3 维空间中的标量和矢量。式(4.29)分解为
∫ A μ d x μ = ∫ ( − A 0 d x 0 + δ i j A i d x j ) = ∫ ( − c Φ d t + A i d x i ) = ∫ d t ( − c Φ + A i v i ) 、 \begin{aligned}
\int A_\mu \mathrm dx^\mu&=\int (-A^0\mathrm dx^0+\delta_{ij}A^i\mathrm dx^j)=\int (-c\Phi\mathrm dt+A_i\mathrm dx^i)\\
&=\int \mathrm dt(-c\Phi+A_iv^i)
\end{aligned}、
∫ A μ d x μ = ∫ ( − A 0 d x 0 + δ ij A i d x j ) = ∫ ( − c Φ d t + A i d x i ) = ∫ d t ( − c Φ + A i v i ) 、
可以得到电磁场中相对论性带电粒子作用量的 3 维形式即
S = ∫ d t L , L = − m c 2 1 − v 2 c 2 − e Φ + e c v ⋅ A (4.34) \boxed{S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A} \tag{4.34}
S = ∫ d t L , L = − m c 2 1 − c 2 v 2 − e Φ + c e v ⋅ A ( 4.34 )
将式(4.34)对 x i x^i x i 变分可得到运动方程的 3 维形式
d p d t = e E + e c v × B (4.35) \frac{\mathrm dp}{\mathrm dt}=eE+\frac{e}{c}v\times B \tag{4.35}
d t d p = e E + c e v × B ( 4.35 )
其中 p p p 为 3-动量式。
E = − ∇ Φ − 1 c ∂ A ∂ t , B = ∇ × A (4.36) E=-\nabla \Phi-\frac 1c \frac{\partial A}{\partial t},\quad B=\nabla\times A\tag{4.36}
E = − ∇Φ − c 1 ∂ t ∂ A , B = ∇ × A ( 4.36 )
分别为电场强度 E E E 和磁感应强度 B B B 。式(4.35)的右边正是带电粒子在电磁场中所受的洛伦兹力。
推导
δ S = ∫ d t δ ( − m c 2 1 − v 2 c 2 − e Φ + e c v ⋅ A ) = ∫ d t [ m v i 1 − v 2 c 2 δ v i − e ∂ Φ ∂ x i δ x i + e c ( A i δ v i + v i δ A i ) ] ≃ ∫ d t ( − d p i d t − e ∂ Φ ∂ x i − e c ∂ A ∂ t + e c ( v j ∂ A j ∂ x i − ∂ A i ∂ x j v j ) ) δ x i \begin{aligned}
\delta S &=\int \mathrm dt\delta\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A \right)\\
&=\int \mathrm dt\left[\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\delta v^i-e\frac{\partial \Phi}{\partial x^i}\delta x^i+\frac{e}{c}\left(A_i\delta v^i+v^i\delta A_i \right) \right]\\
&\simeq \int \mathrm dt\left(-\frac{\mathrm d p_i}{\mathrm dt}-e\frac{\partial \Phi}{\partial x^i} -\frac{e}{c}\frac{\partial A}{\partial t}+\frac{e}{c}\left(v^j\frac{\partial A_j}{\partial x^i} -\frac{\partial A_i}{\partial x^j}v^j\right) \right)\delta x^i
\end{aligned}
δ S = ∫ d t δ ( − m c 2 1 − c 2 v 2 − e Φ + c e v ⋅ A ) = ∫ d t 1 − c 2 v 2 m v i δ v i − e ∂ x i ∂ Φ δ x i + c e ( A i δ v i + v i δ A i ) ≃ ∫ d t ( − d t d p i − e ∂ x i ∂ Φ − c e ∂ t ∂ A + c e ( v j ∂ x i ∂ A j − ∂ x j ∂ A i v j ) ) δ x i
其中
v j ∂ A j ∂ x i − ∂ A i ∂ x j v j = v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A = v × ( ∇ × A ) v^j\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}v^j=v\cdot(\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A)
v j ∂ x i ∂ A j − ∂ x j ∂ A i v j = v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A = v × ( ∇ × A )
整理得到
d p d t = e ( − ∇ Φ − 1 c ∂ A ∂ t ) + c e v × ( ∇ × A ) \frac{\mathrm dp}{\mathrm dt}=e\left(-\nabla \Phi-\frac{1}{c}\frac{\partial A}{\partial t} \right)+\frac{c}{e}v\times(\nabla\times A)
d t d p = e ( − ∇Φ − c 1 ∂ t ∂ A ) + e c v × ( ∇ × A )
下证 v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A = v × ( ∇ × A ) v\cdot (\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A) v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A = v × ( ∇ × A )
[ v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A ] i = v j ( ∂ i A j − ∂ j A i ) [v\cdot(\nabla A)-(v\cdot\nabla)A]_i=v_j(\partial _i A_j-\partial _jA_i )
[ v ⋅ ( ∇ A ) − ( v ⋅ ∇ ) A ] i = v j ( ∂ i A j − ∂ j A i )
而
[ v × ( ∇ × A ) ] i = ϵ i j k v j ( ϵ k m n ∂ m A n ) = ( δ i m δ j n − δ i n δ j m ) v j ∂ m A n = v j ( ∂ i A j − ∂ j A i ) \begin{aligned}
{[v\times(\nabla\times A)]}_i &=\epsilon_{ijk}v_j(\epsilon_{kmn}\partial_m A_n)\\
&=(\delta_{im}\delta_{jn}-\delta_{in}\delta_{jm})v_j\partial_mA_n\\
&=v_j(\partial _i A_j-\partial_jA_i)
\end{aligned}
[ v × ( ∇ × A )] i = ϵ ijk v j ( ϵ kmn ∂ m A n ) = ( δ im δ jn − δ in δ jm ) v j ∂ m A n = v j ( ∂ i A j − ∂ j A i )
4.5 非相对论极限下作用量的基本形式
在非相对论极限下,作用量具有形式
S = ∫ d t L = ∫ d t ( T − V ) (4.37) S=\int \mathrm dt L=\int \mathrm dt(T-V) \tag{4.37}
S = ∫ d t L = ∫ d t ( T − V ) ( 4.37 )
其中 T T T 被称为动能 (kinetic energy),V V V 被称作势能 (potential energy)。
对于 N N N 个粒子组成的粒子系统,记第 α \alpha α 个粒子的直角坐标为 x ( α ) x_{(\alpha)} x ( α ) ,则系统的总动能为
T = ∑ α = 1 N 1 2 m ( α ) x ˙ ( α ) 2 (4.38) T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\dot{x}^2_{(\alpha)} \tag{4.38}
T = α = 1 ∑ N 2 1 m ( α ) x ˙ ( α ) 2 ( 4.38 )
若换为广义坐标 { q a } , a = 1 , ⋯ , 3 N \{q^a\},a=1,\cdots,3N { q a } , a = 1 , ⋯ , 3 N ,则有
x ( α ) = x ( α ) ( t , q ) , α = 1 , ⋯ , N (4.39) x_{(\alpha)}=x_{(\alpha)}(t,q),\quad \alpha=1,\cdots,N \tag{4.39}
x ( α ) = x ( α ) ( t , q ) , α = 1 , ⋯ , N ( 4.39 )
速度的变换关系为
x ˙ ( α ) ≡ ∂ x ( α ) ∂ q a q ˙ a + ∂ x ( α ) ∂ t (4.40) \dot{x}_{(\alpha)}\equiv\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t}\tag{4.40}
x ˙ ( α ) ≡ ∂ q a ∂ x ( α ) q ˙ a + ∂ t ∂ x ( α ) ( 4.40 )
于是动能用广义坐标 { q } \{q\} { q } 及广义速度 { q ˙ } \{\dot{q}\} { q ˙ } 表示为
T = ∑ α = 1 N 1 2 m ( α ) ( ∂ x ( α ) ∂ q a q ˙ a + ∂ x ( α ) ∂ t ) ⋅ ( ∂ x ( α ) ∂ q b q ˙ b + ∂ x ( α ) ∂ t ) (4.41) T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\left(\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t} \right)\cdot\left(\frac{\partial x_{(\alpha)}}{\partial q^b}\dot{q}^b+\frac{\partial x_{(\alpha)}}{\partial t} \right) \tag{4.41}
T = α = 1 ∑ N 2 1 m ( α ) ( ∂ q a ∂ x ( α ) q ˙ a + ∂ t ∂ x ( α ) ) ⋅ ( ∂ q b ∂ x ( α ) q ˙ b + ∂ t ∂ x ( α ) ) ( 4.41 )
整理得到
T = 1 2 G a b q ˙ a q ˙ b + X a q ˙ a + Y (4.42) T=\frac{1}{2}G_{ab}\dot{q}^a\dot{q}^b+X_a\dot{q}^a+Y\tag{4.42}
T = 2 1 G ab q ˙ a q ˙ b + X a q ˙ a + Y ( 4.42 )
即动能为广义速度的二次多项式,其中
G a b ( t , q ) = ∑ α = 1 N m ( α ) ∂ x ( α ) ∂ x a ⋅ ∂ x ( α ) ∂ x b (4.43) G_{ab}(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial x^a}\cdot\frac{\partial x_{(\alpha)}}{\partial x^b}\tag{4.43}
G ab ( t , q ) = α = 1 ∑ N m ( α ) ∂ x a ∂ x ( α ) ⋅ ∂ x b ∂ x ( α ) ( 4.43 )
X a ( t , q ) = ∑ α = 1 N m ( α ) ∂ x ( α ) ∂ q a ⋅ ∂ x ( α ) ∂ t (4.44) X_a(t,q)=\sum_{\alpha=1}^Nm_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial q^a}\cdot \frac{\partial x_{(\alpha)}}{\partial t} \tag{4.44}
X a ( t , q ) = α = 1 ∑ N m ( α ) ∂ q a ∂ x ( α ) ⋅ ∂ t ∂ x ( α ) ( 4.44 )
Y ( t , q ) = ∑ α = 1 N m ( α ) ∂ x ( α ) ∂ t ⋅ ∂ x ( α ) ∂ t (4.45) Y(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial t}\cdot\frac{\partial x_{(\alpha)}}{\partial t} \tag{4.45}
Y ( t , q ) = α = 1 ∑ N m ( α ) ∂ t ∂ x ( α ) ⋅ ∂ t ∂ x ( α ) ( 4.45 )
都只是与广义坐标和 t t t 的函数,与广义速度无关。
若约束非定常,则从直角坐标到广义坐标的变换 x ( α ) ( t , q ) x_{(\alpha)}(t,q) x ( α ) ( t , q ) 显含时间,因此 X a X_a X a 和 Y Y Y 一般不为零。对于定常系统, x ( α ) ( q ) x_{(\alpha)}(q) x ( α ) ( q ) 不显含时间,因此
∂ x ( α ) ∂ t = 0 ⇒ X a = 0 , Y = 0 (4.46) \frac{\partial x_{(\alpha)}}{\partial t}=0\ \Rightarrow\ X_a=0,\ Y=0 \tag{4.46}
∂ t ∂ x ( α ) = 0 ⇒ X a = 0 , Y = 0 ( 4.46 )
这意味着对于定常系统,动能总是广义速度的二次型
T = 1 2 G a b ( q ) q ˙ a q ˙ b (4.47) T=\frac{1}{2} G_{ab}(q) \dot{q}^a\dot{q}^b \tag{4.47}
T = 2 1 G ab ( q ) q ˙ a q ˙ b ( 4.47 )
这里 G a b ( q ) G_{ab}(q) G ab ( q ) 一般依赖于广义坐标,是一个对称、正定的矩阵,势能 V V V 则只是广义坐标的函数
V = V ( q ) (4.48) V=V(q) \tag{4.48}
V = V ( q ) ( 4.48 )
总之,非相对论性定常系统的拉格朗日量的一般形式即
L = T − V = 1 2 G a b ( q ) q ˙ a q ˙ b − V ( q ) (4.49) L=T-V=\frac 12 G_{ab}(q)\dot{q}^a\dot{q}^b -V(q)\tag{4.49}
L = T − V = 2 1 G ab ( q ) q ˙ a q ˙ b − V ( q ) ( 4.49 )
Chapter 5 对称性和守恒律
5.1 运动常数
考虑自由度为 s s s 的完整系统,由广义坐标 q q q 描述,拉格朗日量为 L = L ( t , q , q ˙ ) L=L(t,\boldsymbol q, \dot{\boldsymbol q}) L = L ( t , q , q ˙ ) 系统运动方程的解为 { q c l ( t ) } \{q_{cl}(t)\} { q c l ( t )} ,即对应真实的运动。广义坐标 { q c l ( t ) } \{q_{cl}(t)\} { q c l ( t )} 及广义速度 { q ˙ c l ( t ) } \{\dot{q}_{cl}(t) \} { q ˙ c l ( t )} 一般是随时间变化的,但是存在 { t , q , q ˙ } \{t,\boldsymbol q,\dot{\boldsymbol q} \} { t , q , q ˙ } 组成的函数 C = C ( t , q , q ˙ ) C=C(t,\boldsymbol q,\dot {\boldsymbol q}) C = C ( t , q , q ˙ ) ,其值只取决于初始条件,在真实的运动过程中保持不变,即有
d C ( t , q ( t ) , q ( t ) ) ˙ d t ∣ q c l = 0 (5.1) \left . \frac{\mathrm d C(t,\boldsymbol q(t),\dot {\boldsymbol q(t))}}{\mathrm dt}\right |_{q_{cl}}=0
\tag{5.1}
d t d C ( t , q ( t ) , q ( t )) ˙ q c l = 0 ( 5.1 )
这样的函数被称为运动常数 (constant of motion)。
Example 5.1 一维谐振子的运动常数
考虑一维谐振子,拉格朗日量为 L = T − V = 1 2 m q ˙ 2 − 1 2 m ω 2 q 2 L=T-V=\frac 12 m\dot q^2-\frac 12 m\omega^2q^2 L = T − V = 2 1 m q ˙ 2 − 2 1 m ω 2 q 2 ,运动方程为 q ¨ + ω 2 q = 0 \ddot q+\omega ^2q=0 q ¨ + ω 2 q = 0 。对应初始条件 q ( 0 ) = q 0 q(0)=q_0 q ( 0 ) = q 0 ,q ˙ ( 0 ) = v 0 \dot q(0)=v_0 q ˙ ( 0 ) = v 0 的解为
q c l = q 0 cos ( ω t ) + v 0 1 ω sin ( ω t ) q_{cl}=q_0\cos(\omega t)+v_0\frac 1\omega\sin(\omega t)
q c l = q 0 cos ( ω t ) + v 0 ω 1 sin ( ω t )
对定解式求导,得到
q ˙ c l = − q 0 ω sin ( ω t ) + v 0 cos ( ω t ) \dot q_{cl}=-q_0\omega\sin(\omega t)+v_0\cos(\omega t)
q ˙ c l = − q 0 ω sin ( ω t ) + v 0 cos ( ω t )
从中可以将 q 0 q_0 q 0 和 v 0 v_0 v 0 解出
q 0 = q c l cos ( ω t ) − q ˙ c l ω sin ( ω t ) , v 0 = q c l ω sin ( ω t ) + q ˙ c l cos ( ω t ) q_0=q_{cl}\cos(\omega t)-\frac{\dot q_{cl}}{\omega}\sin(\omega t),\quad v_0=q_{cl}\omega\sin(\omega t)+\dot q_{cl}\cos(\omega t)
q 0 = q c l cos ( ω t ) − ω q ˙ c l sin ( ω t ) , v 0 = q c l ω sin ( ω t ) + q ˙ c l cos ( ω t )
这里的 q 0 = q 0 ( t , q , q ˙ ) q_0=q_0(t,q,\dot q) q 0 = q 0 ( t , q , q ˙ ) 和 v 0 = v 0 ( t , q , q ˙ ) v_0=v_0(t,q,\dot q) v 0 = v 0 ( t , q , q ˙ ) 即运动常数,即当 q = q c l q=q_{cl} q = q c l 时为常数。可以验证,两者的组合
1 2 m ( ω 2 q 0 2 + v 0 2 ) = 1 2 m q ˙ 2 + 1 2 m ω 2 q 2 ≡ E ( q , q ˙ ) \frac 12 m(\omega^2q_0^2+v_0^2)=\frac 12 m\dot q^2+\frac 12 m \omega^2 q^2\equiv E(q,\dot q)
2 1 m ( ω 2 q 0 2 + v 0 2 ) = 2 1 m q ˙ 2 + 2 1 m ω 2 q 2 ≡ E ( q , q ˙ )
也是运动常数,且不显含时间。
如果运动常数只是 { q , q ˙ } \{\boldsymbol q,\dot {\boldsymbol q}\} { q , q ˙ } 的函数,不显含时间 t t t ,也被称为“整体”运动常数。考虑自由度为 s s s 的系统,其运动方程为 s s s 个二阶微分方程,需要 2 s 2s 2 s 个初始条件,亦即 2 s 2s 2 s 个常数 C 1 , C 2 , ⋯ , C 2 s C_1,C_2,\cdots,C_{2s} C 1 , C 2 , ⋯ , C 2 s 来确定一组解,记作
q c l a = q c l a ( t , C 1 , ⋯ , C 2 s ) , a = 1 , ⋯ , s (5.2) q_{cl}^a=q_{cl}^a(t,C_1,\cdots,C_{2s}),\quad a=1,\cdots,s\tag{5.2}
q c l a = q c l a ( t , C 1 , ⋯ , C 2 s ) , a = 1 , ⋯ , s ( 5.2 )
式(5.2)对时间求导,得到
q ˙ c l a = q ˙ c l a ( t , C 1 , ⋯ , C 2 s ) , a = 1 , ⋯ , s (5.3) \dot q_{cl}^a=\dot q_{cl}^a(t,C_1,\cdots,C_{2s}),a=1,\cdots,s \tag{5.3}
q ˙ c l a = q ˙ c l a ( t , C 1 , ⋯ , C 2 s ) , a = 1 , ⋯ , s ( 5.3 )
这 2 s 2s 2 s 个函数是独立的,可以从这 2 s 2s 2 s 个式子中的某一个解出时间参数 t t t ,再代入剩下的 2 s − 1 2s-1 2 s − 1 个式子中,即得到 2 s − 1 2s-1 2 s − 1 个不显含时间的 { q , q ˙ } \{\boldsymbol q,\dot {\boldsymbol q}\} { q , q ˙ } 和 C 1 , ⋯ , C 2 s C_1,\cdots,C_{2s} C 1 , ⋯ , C 2 s 的关系式。从中可以再解出 2 s 2s 2 s 个常数 C 1 , ⋅ , C 2 s C_1,\cdot,C_{2s} C 1 , ⋅ , C 2 s 中的 2 s − 1 2s-1 2 s − 1 个,作为 { q , q ˙ } \{\boldsymbol q,\dot{\boldsymbol q}\} { q , q ˙ } 的函数,即整体运动常数。因此,自由度为 s s s 的系统,具有 2 s − 1 2s-1 2 s − 1 个独立的整体运动常数。整体运动常数通常与系统的对称性有关,因此具有特别的重要性。
假定系统由 A A A 和 B B B 两部分组成,且有各自的拉格朗日量
L A = T A − V A , L B = T B − V B (5.4) L_A=T_A-V_A,\quad L_B=T_B-V_B \tag{5.4}
L A = T A − V A , L B = T B − V B ( 5.4 )
若两部分的相互作用可以忽略,则动能和势能为两部分之和,因此
T = T A + T B , V = V A + V B ⇒ L = L A + L B (5.5) T=T_A+T_B,\quad V=V_A+V_B\quad \Rightarrow\quad L=L_A+L_B \tag{5.5}
T = T A + T B , V = V A + V B ⇒ L = L A + L B ( 5.5 )
因此,对于没有相互作用的多个子系统构成的系统,拉格朗日量具有可加性 (additicity)。此时系统拉格朗日量 L L L 对应某子系统的运动方程,与子系统自身拉格朗日量对应的运动方程完全一致,就像其他子系统不存在一样。此时,拉格朗日量和对应的运动方程被称为是退耦 (decoupled)的。常常在一组广义坐标中耦合在一起的各个子系统,选取另一组广义坐标后,就变成退耦或者近似退耦的。
根据是否“可加”,可将运动常数分为“可加/不可加”两类。具有可加性的运动常数也被称为守恒量,在经典力学范围内有 7 个普适的守恒量:能量(1个),动量(3个),角动量(3个)。这些守恒量与时空对称性有着深刻的联系。
5.2 广义动量、能量守恒
5.2.1 广义动量守恒
若拉格朗日量中不出现“某个”广义坐标 q a q^a q a ,即若
∂ L ∂ q a = 0 (5.6) \frac{\partial L}{\partial q^a}=0\tag{5.6}
∂ q a ∂ L = 0 ( 5.6 )
则称此坐标为循环坐标 (cyclic coordinate)。若 q a q^a q a 为循环坐标,则其对应的拉格朗日量为
0 = d d t ( ∂ L ∂ q ˙ a ) − ∂ L ∂ q a ⏟ = 0 = d d t ( ∂ L ∂ q ˙ a ) (5.7) 0=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\underbrace{\frac{\partial L}{\partial q^a}}_{=0}=\frac{\mathrm d}{\mathrm dt}\left( \frac{\partial L}{\partial \dot q^a}\right)\tag{5.7}
0 = d t d ( ∂ q ˙ a ∂ L ) − = 0 ∂ q a ∂ L = d t d ( ∂ q ˙ a ∂ L ) ( 5.7 )
上式表明 ∂ L ∂ q ˙ \frac{\partial L}{\partial \dot q} ∂ q ˙ ∂ L 对时间的全导数为零,于是得到
p a ≡ ∂ L ∂ q ˙ a = c o n s t (5.8) p_a\equiv\frac{\partial L}{\partial \dot q^a}=const \tag{5.8}
p a ≡ ∂ q ˙ a ∂ L = co n s t ( 5.8 )
因此,循环坐标的共轭动量是运动常数。
5.2.2 广义能量守恒
考虑 s s s 自由度的系统,拉格朗日量 L L L 对时间 t t t 的全导数为
d L d t = ∂ L ∂ t + ∂ L ∂ q a q ˙ a + ∂ L ∂ q ˙ a q ¨ a = ∂ L ∂ t + ∂ L ∂ q a q ˙ a + d d t ( ∂ L ∂ q ˙ a q ˙ a ) − d d t ( ∂ L ∂ q ˙ ) q ˙ a = ∂ L ∂ t + [ d d t ( ∂ L ∂ q ˙ a ) − ∂ L ∂ q a ] ⏟ = 0 q ˙ a + d d t ( ∂ L ∂ q ˙ a q ˙ a ) (5.9) \begin{aligned}
\frac{\mathrm dL}{\mathrm dt}&=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a\right )-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q} \right)\dot q^a\\
&=\frac{\partial L}{\partial t}+\underbrace{\left[\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a} \right]}_{=0}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a \right)
\end{aligned}
\tag{5.9}
d t d L = ∂ t ∂ L + ∂ q a ∂ L q ˙ a + ∂ q ˙ a ∂ L q ¨ a = ∂ t ∂ L + ∂ q a ∂ L q ˙ a + d t d ( ∂ q ˙ a ∂ L q ˙ a ) − d t d ( ∂ q ˙ ∂ L ) q ˙ a = ∂ t ∂ L + = 0 [ d t d ( ∂ q ˙ a ∂ L ) − ∂ q a ∂ L ] q ˙ a + d t d ( ∂ q ˙ a ∂ L q ˙ a ) ( 5.9 )
因此当运动方程满足时,有下式
d d t ( ∂ L ∂ q ˙ a q ˙ a − L ) + ∂ L ∂ t = 0 (5.10) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a-L \right)+\frac{\partial L}{\partial t}=0 \tag{5.10}
d t d ( ∂ q ˙ a ∂ L q ˙ a − L ) + ∂ t ∂ L = 0 ( 5.10 )
定义能量函数 (energy funtion)
h ( t , q , q ˙ ) : = ∂ L ∂ q ˙ q ˙ − L ( t , q , q ˙ ) (5.11) h(t,q,\dot q):=\frac{\partial L}{\partial\dot q}\dot q-L(t,q,\dot q)\tag{5.11}
h ( t , q , q ˙ ) := ∂ q ˙ ∂ L q ˙ − L ( t , q , q ˙ ) ( 5.11 )
于是式(5.10)意味着
d h d t = − ∂ L ∂ t (5.12) \frac{\mathrm dh}{\mathrm dt}=-\frac{\partial L}{\partial t}\tag{5.12}
d t d h = − ∂ t ∂ L ( 5.12 )
若物理系统的拉格朗日量不显含时间参数,即不存在任何特别的时间标记,则有
∂ L ∂ t = 0 ⇒ h = h ( t , q , q ˙ ) = c o n s t (5.13) \frac{\partial L}{\partial t}=0\quad \Rightarrow\quad h=h(t,\boldsymbol q,\dot{\boldsymbol q})=const \tag{5.13}
∂ t ∂ L = 0 ⇒ h = h ( t , q , q ˙ ) = co n s t ( 5.13 )
即若拉格朗日量不显含时间,则能量函数是运动常数。因此能量函数守恒,这样的系统又被称作保守系统 (conservative system)。
5.3 时空对称性与守恒量
5.3.1 空间的均匀性和各向同性
考虑 N N N 个粒子组成的粒子系统。广义坐标为普通的直角坐标 { x ( α ) } , α = 1 , ⋯ , N \{x_{(\alpha)} \},\alpha=1,\cdots,N { x ( α ) } , α = 1 , ⋯ , N ,拉格朗日量为
L = L ( t , x ( 1 ) , ⋯ , x ( N ) , x ˙ ( 1 ) , ⋯ , x ˙ ( N ) ) (5.14) L=L(t,x_{(1)},\cdots,x_{(N)},\dot x_{(1)},\cdots,\dot x_{(N)}) \tag{5.14}
L = L ( t , x ( 1 ) , ⋯ , x ( N ) , x ˙ ( 1 ) , ⋯ , x ˙ ( N ) ) ( 5.14 )
考虑空间坐标的无穷小变换:
x ( α ) ( t ) → x ~ ( α ) ( t ) = x ( α ) + δ x ( α ) ( t ) , α = 1 , ⋯ , N (5.15) x_{(\alpha)}(t)\to\tilde{x}_{(\alpha)}(t)=x_{(\alpha)}+\delta x_{(\alpha)}(t),\quad \alpha=1,\cdots,N \tag{5.15}
x ( α ) ( t ) → x ~ ( α ) ( t ) = x ( α ) + δ x ( α ) ( t ) , α = 1 , ⋯ , N ( 5.15 )
注意在这里每个粒子可能有不同的 δ x ( α ) \delta x_{(\alpha)} δ x ( α ) 。在空间坐标的变换式(5.15)下,作用量的变化为
δ S = ∫ d t ( ∂ L ∂ x ( α ) δ x ( α ) + ∂ L ∂ x ˙ ( α ) δ x ˙ ( α ) ) = ∫ d t [ − ( d d t ∂ L ∂ x ˙ ( α ) − ∂ L ∂ x ( α ) ) ⏟ = 0 δ x ( α ) + d d t ( ∂ L ∂ x ˙ ( α ) δ x ( α ) ) ] (5.16) \begin{aligned}
\delta S&=\int \mathrm dt\left(\frac{\partial L}{\partial x_{(\alpha)}}\delta x_{(\alpha)}+\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta \dot x_{(\alpha)} \right)\\
&=\int \mathrm dt\left[-\underbrace{\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x_{(\alpha)}}-\frac{\partial L}{\partial x_{(\alpha)}} \right)}_{=0}\delta x_{(\alpha)}+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)} \right) \right]
\end{aligned}
\tag{5.16}
δ S = ∫ d t ( ∂ x ( α ) ∂ L δ x ( α ) + ∂ x ˙ ( α ) ∂ L δ x ˙ ( α ) ) = ∫ d t − = 0 ( d t d ∂ x ˙ ( α ) ∂ L − ∂ x ( α ) ∂ L ) δ x ( α ) + d t d ( ∂ x ˙ ( α ) ∂ L δ x ( α ) ) ( 5.16 )
因此,当运动方程满足时(即真实演化),如果要求作用量在空间坐标的连续变换下保持不变,即 δ S = 0 \delta S=0 δ S = 0 ,则必须有
d d t ( ∂ L ∂ x ˙ ( α ) δ x ( α ) ) = 0 ⇒ ∑ α = 1 N p ( α ) δ x ( α ) = c o n s t (5.17) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)}\right)=0\quad \Rightarrow \quad\sum_{\alpha =1}^N p_{(\alpha)}\delta x_{(\alpha)}=const \tag{5.17}
d t d ( ∂ x ˙ ( α ) ∂ L δ x ( α ) ) = 0 ⇒ α = 1 ∑ N p ( α ) δ x ( α ) = co n s t ( 5.17 )
其中 p ( α ) ≡ ∂ L ∂ x ˙ ( α ) p_{(\alpha)}\equiv \frac{\partial L}{\partial \dot x_{(\alpha)}} p ( α ) ≡ ∂ x ˙ ( α ) ∂ L 是第 α \alpha α 个粒子的动量。
考虑时间坐标的任意整体**平移 **(translation)
δ x ( 1 ) = δ x ( 2 ) = ⋯ = δ x ( N ) ≡ ξ ≡ a ξ ^ = c o n s t a n t v e c t o r (5.18) \delta x_{(1)}=\delta x_{(2)}=\cdots =\delta x_{(N)}\equiv \boldsymbol \xi\equiv a \boldsymbol{\hat \xi}=constant\ vector \tag{5.18}
δ x ( 1 ) = δ x ( 2 ) = ⋯ = δ x ( N ) ≡ ξ ≡ a ξ ^ = co n s t an t v ec t or ( 5.18 )
其中 a a a 是常数,代表平移的距离;ξ ^ \hat \xi ξ ^ 是与时间无关的任意常单位矢量,代表平移的方向。对于 N N N 个粒子组成的粒子系统来说,这意味着所有粒子的空间坐标朝着 ξ ^ \hat \xi ξ ^ 方向整体平移了相同的距离 a a a 。如果系统再空间整体平移的变化下,作用量不变则称系统具有空间均匀性 (spatial homogeneity)。这是式(5.17)变成
∑ α = 1 N p ( α ) ⋅ ( a ξ ^ ) = c o n s t (5.19) \sum_{\alpha =1}^N p_{(\alpha)}\cdot(a\boldsymbol{\hat \xi})=const\tag{5.19}
α = 1 ∑ N p ( α ) ⋅ ( a ξ ^ ) = co n s t ( 5.19 )
而因为 a a a 是个常数,这意味着
p 总 ⋅ ξ ^ = c o n s t (5.20) p_总\cdot \boldsymbol{\hat \xi}=const \tag{5.20}
p 总 ⋅ ξ ^ = co n s t ( 5.20 )
这里
p 总 ≡ ∑ α = 1 N p ( α ) ≡ ∑ α = 1 N ∂ L ∂ x ˙ ( α ) (5.21) p_总\equiv\sum_{\alpha=1}^Np_{(\alpha)} \equiv \sum_{\alpha =1}^N\frac{\partial L}{\partial \dot x_{(\alpha)}}\tag{5.21}
p 总 ≡ α = 1 ∑ N p ( α ) ≡ α = 1 ∑ N ∂ x ˙ ( α ) ∂ L ( 5.21 )
是该系统的总动量。因此,如果系统沿着某个方向具有空间均匀性,则系统的总线动量在此方向的分量守恒。
在 3 维欧氏空间中的无穷小转动下,直角坐标的变换为 δ x = ϕ n × x \delta x=\phi \boldsymbol n\times \boldsymbol x δ x = ϕ n × x .其中 n \boldsymbol n n 是任意单位常矢量。代表转动的转轴方向;ϕ \phi ϕ 是任意无量纲常数,代表无穷小转动角度。于是所有粒子共同做整体转动即
δ x ( α ) = ϕ n × x ( α ) , α = 1 , ⋯ , N (5.22) \delta \boldsymbol x_{(\alpha)}=\phi \boldsymbol n\times \boldsymbol x_{(\alpha)},\quad \alpha=1,\cdots ,N \tag{5.22}
δ x ( α ) = ϕ n × x ( α ) , α = 1 , ⋯ , N ( 5.22 )
2025.10.23 理论力学课上 3 维转动矩阵 R ( n ^ , θ ) \boldsymbol R(\hat n,\theta) R ( n ^ , θ ) 推导:
考虑 r ⃗ \vec r r 为三维列向量,并设 v ⃗ ∥ \vec{v}_{\parallel} v ∥ 和 v ⃗ ⊥ \vec v_{\perp} v ⊥ 为平行和垂直于 n ^ \hat n n ^ 方向上的分量,有
{ v ⃗ ∥ = ( v ⃗ ⋅ n ^ ) n ^ v ⃗ ⊥ = v ⃗ − ( v ⃗ ⋅ n ^ ) n ^ \begin{cases}
\vec v_{\parallel}=(\vec v\cdot \hat n)\hat n\\
\vec v_{\perp}=\vec v-(\vec v\cdot \hat n)\hat n
\end{cases}
{ v ∥ = ( v ⋅ n ^ ) n ^ v ⊥ = v − ( v ⋅ n ^ ) n ^
建立直角坐标系 { n ^ , v ^ ⊥ , n ^ × v ^ ⊥ } \{\hat n,\hat v_{\perp},\hat n\times \hat v_{\perp} \} { n ^ , v ^ ⊥ , n ^ × v ^ ⊥ } ,其中 v ^ ⊥ = v ⃗ ⊥ ∣ v ⃗ ⊥ ∣ \hat v_{\perp}=\frac{\vec v_{\perp}}{|\vec v_{\perp}|} v ^ ⊥ = ∣ v ⊥ ∣ v ⊥ 。
考虑 3 维转动矩阵 R ( n ^ , θ ) \boldsymbol R(\hat n,\theta) R ( n ^ , θ )
R ( n ^ , θ ) v ⃗ = R ( n ^ , θ ) v ⃗ ∥ + R ( n ^ , θ ) v ⃗ ⊥ = v ⃗ ∥ + ∣ v ⃗ ⊥ ∣ cos θ v ^ ⊥ + ∣ v ⃗ ⊥ ∣ sin θ n ^ × v ^ ⊥ = ( v ⃗ ⋅ n ^ ) n ^ + [ v ⃗ − ( v ⃗ ⋅ n ^ ) n ^ ] cos θ + sin θ n ^ × [ v ⃗ − ( v ⃗ ⋅ n ^ ) n ^ ] = ( 1 − cos θ ) ( v ⃗ ⋅ n ^ ) n ^ + cos θ v ⃗ + sin θ n ^ × v ⃗ \begin{aligned}
\boldsymbol R(\hat n,\theta)\vec v&=\boldsymbol R(\hat n,\theta)\vec v_{\parallel}+\boldsymbol R(\hat n,\theta)\vec v_{\perp}\\
&=\vec v_{\parallel}+ |\vec v_{\perp}|\cos\theta \hat v_{\perp}+|\vec v_{\perp} |\sin\theta \hat n\times \hat v_{\perp}\\
&=(\vec v\cdot \hat n)\hat n+[\vec v-(\vec v\cdot \hat n)\hat n]\cos\theta+\sin\theta\hat n\times[\vec v-(\vec v\cdot \hat n)\hat n]\\
&=(1-\cos\theta)(\vec v\cdot \hat n)\hat n+\cos\theta \vec v+\sin\theta\hat n\times\vec v
\end{aligned}
R ( n ^ , θ ) v = R ( n ^ , θ ) v ∥ + R ( n ^ , θ ) v ⊥ = v ∥ + ∣ v ⊥ ∣ cos θ v ^ ⊥ + ∣ v ⊥ ∣ sin θ n ^ × v ^ ⊥ = ( v ⋅ n ^ ) n ^ + [ v − ( v ⋅ n ^ ) n ^ ] cos θ + sin θ n ^ × [ v − ( v ⋅ n ^ ) n ^ ] = ( 1 − cos θ ) ( v ⋅ n ^ ) n ^ + cos θ v + sin θ n ^ × v
其中
( v ⃗ ⋅ n ^ ) n ^ = n ^ T v ⃗ n ^ = n ^ n ^ T v ⃗ (\vec v\cdot\hat n)\hat n=\hat n^T\vec v\hat n=\hat n\hat n^T\vec v
( v ⋅ n ^ ) n ^ = n ^ T v n ^ = n ^ n ^ T v
n ^ × v ⃗ = ϵ i j k n j v k = − ( ϵ i k j n j ) v k \hat n\times \vec v=\epsilon_{ijk}n_jv_k=-(\epsilon_{ikj}n_j)v_k
n ^ × v = ϵ ijk n j v k = − ( ϵ ikj n j ) v k
引入 3 为反对称矩阵 M ( n ^ ) \boldsymbol M(\hat n) M ( n ^ ) ,
M i j ( n ^ ) = − ϵ i j k n k = ( 0 − n 3 n 2 n 3 0 − n 1 − n 2 n 1 0 ) \boldsymbol M_{ij}(\hat n)=-\epsilon_{ijk}n_k=
\begin{pmatrix}
0&-n_3&n_2\\
n_3&0&-n_1\\
-n_2&n_1&0
\end{pmatrix}
M ij ( n ^ ) = − ϵ ijk n k = 0 n 3 − n 2 − n 3 0 n 1 n 2 − n 1 0
得到
R ( n ^ , θ ) v ⃗ = [ ( 1 − cos θ ) n ^ n ^ T + cos θ I 3 + sin θ M ( n ^ ) ] v ⃗ \boldsymbol R(\hat n,\theta)\vec v=[(1-\cos\theta)\hat n\hat n^T+\cos \theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)]\vec v
R ( n ^ , θ ) v = [( 1 − cos θ ) n ^ n ^ T + cos θ I 3 + sin θ M ( n ^ )] v
所以
R ( n ^ , θ ) = ( 1 − cos θ ) n ^ n ^ T + cos θ I 3 + sin θ M ( n ^ ) = ( 1 − cos θ ) n i n j + cos θ δ i j − sin θ ϵ i j k n k = ( ( 1 − cos θ ) n 1 2 + cos θ ( 1 − cos θ ) n 1 n 2 − sin θ n 3 ( 1 − cos θ ) n 1 n 3 + sin θ n 2 ( 1 − cos θ ) n 2 n 1 + sin θ n 3 ( 1 − cos θ ) n 2 2 + cos θ ( 1 − cos θ ) n 2 n 3 − sin θ n 1 ( 1 − cos θ ) n 3 n 1 − sin θ n 2 ( 1 − cos θ ) n 3 n 2 + sin θ n 1 ( 1 − cos θ ) n 3 2 + cos θ ) \begin{aligned}
\boldsymbol R(\hat n,\theta)&=(1-\cos\theta)\hat n\hat n^T+\cos\theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)\\
&=(1-\cos\theta)n_in_j+\cos\theta\delta_{ij}-\sin\theta \epsilon_{ijk}n_k\\
&=
\begin{pmatrix}
(1-\cos\theta)n_1^2+\cos\theta &(1-\cos\theta)n_1n_2-\sin\theta n_3 &(1-\cos\theta)n_1n_3+\sin \theta n_2\\
(1-\cos\theta)n_2n_1+\sin\theta n_3& (1-\cos\theta)n_2^2+\cos\theta&(1-\cos\theta)n_2n_3-\sin\theta n_1\\
(1-\cos\theta)n_3n_1-\sin\theta n_2 &(1-\cos\theta)n_3n_2+\sin\theta n_1 &(1-\cos\theta)n_3^2+\cos\theta
\end{pmatrix}
\end{aligned}
R ( n ^ , θ ) = ( 1 − cos θ ) n ^ n ^ T + cos θ I 3 + sin θ M ( n ^ ) = ( 1 − cos θ ) n i n j + cos θ δ ij − sin θ ϵ ijk n k = ( 1 − cos θ ) n 1 2 + cos θ ( 1 − cos θ ) n 2 n 1 + sin θ n 3 ( 1 − cos θ ) n 3 n 1 − sin θ n 2 ( 1 − cos θ ) n 1 n 2 − sin θ n 3 ( 1 − cos θ ) n 2 2 + cos θ ( 1 − cos θ ) n 3 n 2 + sin θ n 1 ( 1 − cos θ ) n 1 n 3 + sin θ n 2 ( 1 − cos θ ) n 2 n 3 − sin θ n 1 ( 1 − cos θ ) n 3 2 + cos θ
当 θ \theta θ 为无穷小转动时
R ( n ^ , θ ) v ⃗ = [ I 3 + θ M ( n ^ ) ] v ⃗ + O ( θ 2 ) = v ⃗ + θ n ^ × v ⃗ + O ( θ 2 ) \boldsymbol R(\hat n,\theta)\vec v=[I_3+\theta \boldsymbol M(\hat n)]\vec v+O(\theta^2)=\vec v+\theta\hat n\times\vec v+O(\theta^2)
R ( n ^ , θ ) v = [ I 3 + θ M ( n ^ )] v + O ( θ 2 ) = v + θ n ^ × v + O ( θ 2 )
系统在整体转动下作用量不变,则称系统具有绕此方向的空间各向同性 (spatial isotropy)。此时式(5.17)称为
∑ α = 1 N p ( α ) ⋅ ( ϕ n × x ( α ) ) = ∑ α = 1 N ϕ n ⋅ ( x ( α ) × p ( α ) ) = c o n s t (5.23) \sum_{\alpha=1}^N\boldsymbol p_{(\alpha)}\cdot (\phi \boldsymbol n \times \boldsymbol x_{(\alpha)})=\sum_{\alpha =1}^N \phi\boldsymbol n\cdot(\boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)})=const\tag{5.23}
α = 1 ∑ N p ( α ) ⋅ ( ϕ n × x ( α ) ) = α = 1 ∑ N ϕ n ⋅ ( x ( α ) × p ( α ) ) = co n s t ( 5.23 )
这里 ϕ \phi ϕ 是常数,意味着
J 总 ⋅ n = c o n s t (5.24) \boldsymbol J_总\cdot \boldsymbol n=const \tag{5.24}
J 总 ⋅ n = co n s t ( 5.24 )
这里
J 总 = ∑ α = 1 N J ( α ) ≡ ∑ α = 1 N x ( α ) × p ( α ) (5.25) \boldsymbol J_总=\sum_{\alpha=1}^N\boldsymbol J_{(\alpha)}\equiv \sum_{\alpha=1}^N \boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)} \tag{5.25}
J 总 = α = 1 ∑ N J ( α ) ≡ α = 1 ∑ N x ( α ) × p ( α ) ( 5.25 )
是粒子系统的总角动量。因此,如果系统绕某方向具有空间各向同性,则系统总角动量在此方向的分量守恒。
5.3.2 时间的均匀性
若拉格朗日量不显含时间 ∂ L ∂ t = 0 \frac{\partial L}{\partial t}=0 ∂ t ∂ L = 0 ,能量函数 h h h 是运动常数。拉格朗日量不显含时间意味着,系统不存在特别的时间参照点,时间原点可以任意选取,即具有时间均匀性 (temporal homogeneity),即时间是均匀流逝的。反映在拉格朗日量上,即时间平移(η \eta η 是常数)
t → t ~ = t + η (5.26) t\to \tilde t=t+\eta \tag{5.26}
t → t ~ = t + η ( 5.26 )
不会引起拉格朗日量的变化。因此,能量守恒本质上反映的就是时间流逝的均匀性。
5.4 作用量的形式变换
5.4.1 拉格朗日量和全导数
经典力学系统的演化由运动方程决定。初始条件(状态)给定,系统就沿着唯一的一条轨迹(相流)演化。但是拉格朗日量、作用量却有一定不确定性。如图所示,一组确定的运动方程,可以对应多个(无限多个)不如的拉格朗日量。如果两个拉格朗日量对应同一组运动方程,则两者被称为互相等价 (equivalent)。
物理上重要的一种等价关系,来自两个相差“时间全导数”的拉格朗日量。给定某个拉格朗日量 L L L ,加上时间和广义坐标的任意函数 F ( t , q ) F(t,\boldsymbol q) F ( t , q ) 对时间的全导数,得到
L ~ ( t , q , q ˙ ) = L ( t , q , q ˙ ) + d F ( t , q ) d t (5.27) \tilde L(t,\boldsymbol q,\dot{\boldsymbol q}) = L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt}\tag{5.27}
L ~ ( t , q , q ˙ ) = L ( t , q , q ˙ ) + d t d F ( t , q ) ( 5.27 )
对应的作用量变为
S ~ [ q ] = ∫ t 1 t 2 d t L ~ ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( L ( t , q , q ˙ ) + d F ( t , q ) d t ) = S [ q ] + F ( t , q ) ∣ t 1 t 2 (5.28) \begin{aligned}
\tilde S[\boldsymbol q]=\int_{t_1}^{t_2}\mathrm dt \tilde L(t,\boldsymbol q,\dot{\boldsymbol q})&=\int_{t_1}^{t_2}\mathrm dt\left(L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt} \right)\\
&=S[\boldsymbol q]+F(t,\boldsymbol q)|_{t_1}^{t_2}
\end{aligned}
\tag{5.28}
S ~ [ q ] = ∫ t 1 t 2 d t L ~ ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( L ( t , q , q ˙ ) + d t d F ( t , q ) ) = S [ q ] + F ( t , q ) ∣ t 1 t 2 ( 5.28 )
可以验证 δ S ~ = δ S \delta \tilde S=\delta S δ S ~ = δ S 。变换式(5.27)有时也被称作拉格朗日量的规范变换 (gague transformation)。
习惯上用符号 “≃ \simeq ≃ ” 来表示两个拉格朗日量或者作用量等价。即有
L ~ = L + d F d t ⟺ L ~ ≃ L (5.29) \tilde L=L+\frac{\mathrm dF}{\mathrm dt}\iff \tilde L\simeq L\tag{5.29}
L ~ = L + d t d F ⟺ L ~ ≃ L ( 5.29 )
和
S ~ = S + F ∣ t 1 t 2 ⟺ S ~ ≃ S (5.30) \tilde S=S+F|_{t_1}^{t_2}\iff \tilde S\simeq S \tag{5.30}
S ~ = S + F ∣ t 1 t 2 ⟺ S ~ ≃ S ( 5.30 )
值得一提的是,虽然相差时间全导数的两个拉格朗日量给出相同的运动方程,但是共轭动量和能量函数可能不同。由
L ~ = L + d F ( t , q ) d t = L + ∂ F ( t , q ) ∂ t + ∂ F ( t , q ) ∂ q a q ˙ a (5.31) \tilde L=L+\frac{\mathrm dF(t,\boldsymbol q)}{\mathrm dt}=L+\frac{\partial F(t,\boldsymbol q)}{\partial t}+\frac{\partial F(t,\boldsymbol q)}{\partial q^a}\dot q^a\tag{5.31}
L ~ = L + d t d F ( t , q ) = L + ∂ t ∂ F ( t , q ) + ∂ q a ∂ F ( t , q ) q ˙ a ( 5.31 )
于是 q a q^a q a 的共轭动量为
p ~ a ≡ ∂ L ~ ∂ q ˙ a = ∂ L ∂ q ˙ a + ∂ F ∂ q a = p a + ∂ F ∂ q a (5.32) \tilde p_a\equiv \frac{\partial \tilde L}{\partial \dot q^a}=\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial q^a}=p_a+\frac{\partial F}{\partial q^a} \tag{5.32}
p ~ a ≡ ∂ q ˙ a ∂ L ~ = ∂ q ˙ a ∂ L + ∂ q a ∂ F = p a + ∂ q a ∂ F ( 5.32 )
可见广义坐标的共轭动量具有一定任意性,这也是相空间中广义坐标和广义动量必须被视为完全独立的变量的原因之一。对于能量函数
h ~ ≡ ∂ L ~ ∂ q ˙ a q ˙ a − L ~ = ( ∂ L ∂ q ˙ a + ∂ F ∂ q ˙ a ) q ˙ a − ( L + ∂ F ∂ t + ∂ F ∂ q a q ˙ a ) = ∂ L ∂ q ˙ a q ˙ a − L ⏟ = h − ∂ F ∂ t \begin{aligned}
\tilde h\equiv \frac{\partial \tilde L}{\partial \dot q^a}\dot q^a-\tilde L&=\left(\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial \dot q^a} \right)\dot q^a-(L+\frac{\partial F}{\partial t}+\frac{\partial F}{\partial q^a}\dot q^a)\\
&=\underbrace{\frac{\partial L}{\partial \dot q^a}\dot q^a-L}_{=h}-\frac{\partial F}{\partial t}
\end{aligned}
h ~ ≡ ∂ q ˙ a ∂ L ~ q ˙ a − L ~ = ( ∂ q ˙ a ∂ L + ∂ q ˙ a ∂ F ) q ˙ a − ( L + ∂ t ∂ F + ∂ q a ∂ F q ˙ a ) = = h ∂ q ˙ a ∂ L q ˙ a − L − ∂ t ∂ F
可见
h ~ = h − ∂ F ∂ t (5.33) \tilde h=h-\frac{\partial F}{\partial t}\tag{5.33}
h ~ = h − ∂ t ∂ F ( 5.33 )
这一关系在哈密顿力学中被称作哈密顿量的正则变换。
5.4.2 广义坐标的变换
我们采用不同的广义坐标和时间参数描述同一条世界线,对于变换 { t , q } → { t ~ , q ~ } \{t,\boldsymbol q\}\to \{\tilde t,\tilde {\boldsymbol q}\} { t , q } → { t ~ , q ~ } :
t → t ~ = t ~ ( t , q ) , q → q ~ = q ~ ( t , q ) (5.34) t\to \tilde t=\tilde t(t,\boldsymbol q),\quad \boldsymbol q\to\tilde{\boldsymbol q}=\tilde{\boldsymbol q}(t,\boldsymbol q)\tag{5.34}
t → t ~ = t ~ ( t , q ) , q → q ~ = q ~ ( t , q ) ( 5.34 )
本节中,假定时间参数 t t t 不变,重点关注广义坐标的变换。
对于位形空间中给定的某点及其对应的广义速度,因为式(5.34)只是变量代换,所以拉格朗日量的数值本身是不变的,即有
L ( t , q , q ˙ ) → L ~ ( t , q ~ , q ~ ˙ ) ≡ L ( t , q , q ˙ ) (5.35) L(t,\boldsymbol q,\dot{\boldsymbol q})\to\tilde{L}(t,\tilde {\boldsymbol q},\dot{\tilde{\boldsymbol q}})\equiv L(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.35}
L ( t , q , q ˙ ) → L ~ ( t , q ~ , q ~ ˙ ) ≡ L ( t , q , q ˙ ) ( 5.35 )
同样,沿着给定轨迹,作用量的变化为
S [ q ] → S ~ [ q ~ ] : = ∫ d t L ~ ( t , q ~ , q ~ ˙ ) = ∫ d t L ( t , q , q ˙ ) ≡ S [ q ] (5.36) S[\boldsymbol q]\to\tilde S[\tilde{\boldsymbol q}]:=\int \mathrm dt \tilde{L}(t,\tilde {\boldsymbol q},\dot {\tilde{\boldsymbol q}})=\int \mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\equiv S[\boldsymbol q]\tag{5.36}
S [ q ] → S ~ [ q ~ ] := ∫ d t L ~ ( t , q ~ , q ~ ˙ ) = ∫ d t L ( t , q , q ˙ ) ≡ S [ q ] ( 5.36 )
一个问题是,运动方程在广义坐标的变化下如何变化?由
δ S [ q ] ≃ − ∫ d t ( d d t ∂ L ∂ q ˙ a − ∂ L ∂ q a ) δ q a ≡ δ S ~ [ q ~ ] ≃ − ∫ d t ( d d t ∂ L ∂ q ~ a ˙ − ∂ L ~ ∂ q ~ a ) δ q ~ a (5.37) \delta S[\boldsymbol q]\simeq-\int \mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a\equiv\delta \tilde S[\tilde{\boldsymbol q}]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot{\tilde{q}^a}}-\frac{\partial \tilde L}{\partial \tilde{q}^a} \right)\delta \tilde q^a\tag{5.37}
δ S [ q ] ≃ − ∫ d t ( d t d ∂ q ˙ a ∂ L − ∂ q a ∂ L ) δ q a ≡ δ S ~ [ q ~ ] ≃ − ∫ d t ( d t d ∂ q ~ a ˙ ∂ L − ∂ q ~ a ∂ L ~ ) δ q ~ a ( 5.37 )
利用广义坐标的逆变化式
δ q a = ∂ q a ∂ q ~ b δ q ~ b (5.38) \delta q^a=\frac{\partial q^a}{\partial \tilde q^b}\delta \tilde q^b\tag{5.38}
δ q a = ∂ q ~ b ∂ q a δ q ~ b ( 5.38 )
得到运动方程的变换关系
d d t ∂ L ~ ∂ q ~ a ˙ − ∂ L ~ ∂ q ~ a = ∂ q b ∂ q ~ a ( d d t ∂ L ∂ q ˙ b − ∂ L ∂ q b ) , a = 1 , ⋯ , s (5.39) \frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot{\tilde q^a}}-\frac{\partial \tilde L}{\partial \tilde q^a}=\frac{\partial q^b}{\partial \tilde q^a}\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^b}-\frac{\partial L}{\partial q^b} \right),\quad a=1,\cdots,s
\tag{5.39}
d t d ∂ q ~ a ˙ ∂ L ~ − ∂ q ~ a ∂ L ~ = ∂ q ~ a ∂ q b ( d t d ∂ q ˙ b ∂ L − ∂ q b ∂ L ) , a = 1 , ⋯ , s ( 5.39 )
如果将运动方程(即泛函导数 δ S δ q a \frac{\delta S}{\delta q^a} δ q a δ S 和 δ S ~ δ q ~ a \frac{\delta \tilde S}{\delta \tilde q^a} δ q ~ a δ S ~ )整体视为“矢量”,式(5.39)可以写成
δ S ~ δ q ~ a ≡ ∂ q ~ a ∂ q b δ S δ q b = 0 (5.40) \frac{\delta \tilde S}{\delta \tilde q^a}\equiv\frac{\partial \tilde q^a}{\partial q^b}\frac{\delta S}{\delta q^b}=0\tag{5.40}
δ q ~ a δ S ~ ≡ ∂ q b ∂ q ~ a δ q b δ S = 0 ( 5.40 )
其变换像协变矢量。
5.5 对称性
在 5.3 节中已经看到,当拉格朗日量具有某些特殊形式时,会导致广义动量、能量的守恒,更物理的原因是,拉格朗日量的这些特殊形式反映了系统的对称性(symmetry)。简而言之,对称性即系统在某种变换 (transformation)下的不变性 (invariance)。
5.5.1 普通函数的对称性
多元函数 F ( x 1 , ⋯ , x n ) F(x^1,\cdots,x^n) F ( x 1 , ⋯ , x n ) 在自变量 x i x^i x i 的任意无穷小变化 x i → x ~ i = x i + δ x i x^i\to \tilde x^i=x^i+\delta x^i x i → x ~ i = x i + δ x i 下,变化为
δ F = ∂ F ∂ x i δ x i (5.41) \delta F=\frac{\partial F}{\partial x^i}\delta x^i \tag{5.41}
δ F = ∂ x i ∂ F δ x i ( 5.41 )
这里 ∂ F ∂ x i \frac{\partial F}{\partial x^i} ∂ x i ∂ F 是函数在自变量空间中的梯度。“对称变化”和“函数极值”相当于一个问题的一体两面。这个问题即函数在无穷小变化下的不变性,或者说——如何让函数不变。
(1)对于函数极值,相当于问梯度 ∂ F ∂ x i \frac{\partial F}{\partial x^i} ∂ x i ∂ F 满足什么条件时,是的对于任意的自变量的变化 δ x i \delta x^i δ x i ,函数值不变,即
δ F = ∂ F ∂ x i δ x i = 对于任意 δ x i 0 (5.42) \delta F=\frac{\partial F}{\partial x^i}\delta x^i \xlongequal{\text{对于任意 $\delta x^i$}} 0\tag{5.42}
δ F = ∂ x i ∂ F δ x i 对于任意 δ x i 0 ( 5.42 )
由于 δ x a \delta x^a δ x a 时任意的,于是只能要去梯度本身为零,即 ∂ F ∂ x i = 0 \frac{\partial F}{\partial x^i}=0 ∂ x i ∂ F = 0 。
(2)对于对称变换,其相当于问变换 δ x i \delta x^i δ x i 满足什么条件时,使得函数总是不变的,即
δ F = ∂ F ∂ x i δ s x i = 对于任意 δ s x i 0 (5.43) \delta F=\frac{\partial F}{\partial x^i}\delta_s x^i \xlongequal{对于任意\ \delta_s x^i}0 \tag{5.43}
δ F = ∂ x i ∂ F δ s x i 对于任意 δ s x i 0 ( 5.43 )
和 δ x i \delta x_i δ x i 不同,梯度 ∂ F ∂ x i \frac{\partial F}{\partial x^i} ∂ x i ∂ F 由 $F $ 的函数形式决定,所以并不是任意的。所以上式并不能导致 δ s x i = 0 \delta_s x^i=0 δ s x i = 0 ,而只是给出变换 δ s x i \delta_s x^i δ s x i 满足的一个关系式。
可见,函数极值是对梯度 ∂ F ∂ x i \frac{\partial F}{\partial x^i} ∂ x i ∂ F 的限制,而对称变换则是对变换 δ s x i \delta _sx^i δ s x i 的限制,两者以不同的方式实现 δ F = 0 \delta F=0 δ F = 0 ,即函数在变分下的不变性。
5.5.2 时间与广义坐标的变换
在数学上,对称变换则是在时间参数和广义坐标的变换下,作用量本身形式的变换。假设系统的广义坐标和时间参数有某种变换:
(1)时间的重参数化:
t → t ~ = t ~ ( t , q ( t ) , q ˙ ( t ) ) (5.44) t\to \tilde t=\tilde t(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)) \tag{5.44}
t → t ~ = t ~ ( t , q ( t ) , q ˙ ( t )) ( 5.44 )
(2)广义坐标的变换:
q a ( t ) → q ~ a ( t ~ ) = q ~ a ( t , q ( t ) , q ˙ ( t ) ) , a = 1 , ⋯ , s (5.45) q^a(t)\to \tilde q^a(\tilde t)=\tilde q^a(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)),\quad a=1,\cdots,s\tag{5.45}
q a ( t ) → q ~ a ( t ~ ) = q ~ a ( t , q ( t ) , q ˙ ( t )) , a = 1 , ⋯ , s ( 5.45 )
一般来说,变换关系可以含有广义速度。如果变换可以由某个(某些)参数来参数化,且这些参数可以连续取值,则被称作连续变换 (continuous transformation)。对于连续变换,当变换参数为无穷小量时,被称作无穷小变换 (infintesimal transformation)。对于时间参数,其无穷小变换为
δ s t = t ~ − t (5.46) \delta_s t=\tilde t-t\tag{5.46}
δ s t = t ~ − t ( 5.46 )
这里的 δ s \delta_s δ s 代表对称变换。广义坐标的无穷小变换定义为
δ s q a ( t ) : = q ~ a ( t ) − q a ( t ) (5.47) \delta_sq^a(t):=\tilde q^a(t)-q^a(t) \tag{5.47}
δ s q a ( t ) := q ~ a ( t ) − q a ( t ) ( 5.47 )
虽然 δ s q a \delta_sq^a δ s q a 和 δ q a \delta q^a δ q a 在数学形式上一样,但其并不是任意的变分,而是满足某些条件的连续变换。我们还定义
Δ q a ( t ) : = q ~ a ( t ~ ) − q a ( t ) (5.48) \Delta q^a(t):=\tilde q^a(\tilde t)-q^a(t)\tag{5.48}
Δ q a ( t ) := q ~ a ( t ~ ) − q a ( t ) ( 5.48 )
以上 3 个无穷小变换 δ s t \delta_s t δ s t 、 δ s q \delta _s q δ s q 和 Δ q a \Delta q^a Δ q a 的关系如下图所示
由式(5.46)和(5.47),展开得到
Δ q a ( t ) = q ~ a ( t + δ s t ) − q a ( t ) = q ~ a ( t ) + δ S t q ~ ˙ a ( t ) − q a ( t ) \Delta q^a(t)=\tilde q^a(t+\delta_s t)-q^a(t)=\tilde q^a(t)+\delta_S t\dot{\tilde q}^a(t)-q^a(t)
Δ q a ( t ) = q ~ a ( t + δ s t ) − q a ( t ) = q ~ a ( t ) + δ S t q ~ ˙ a ( t ) − q a ( t )
带入 q ~ ˙ a = q ˙ a + d d t ( δ s q a ) \dot{\tilde q}^a=\dot q^a+\frac{\mathrm d}{\mathrm dt}(\delta_s q^a) q ~ ˙ a = q ˙ a + d t d ( δ s q a ) 并保留一阶小量,得到
Δ q a ( t ) = δ s q a + δ s t q ˙ a (5.49) \Delta q^a(t)=\delta_s q^a+\delta_st\dot q^a\tag{5.49}
Δ q a ( t ) = δ s q a + δ s t q ˙ a ( 5.49 )
可见 δ s t \delta _s t δ s t 、δ s q a \delta_s q^a δ s q a 和 Δ q a \Delta q^a Δ q a 中只有 2 个是独立的。式(5.49)也可以由上图直观理解。定义
Δ q ˙ a ( t ) : = d q ~ a ( t ~ ) d t ~ − d q a ( t ) d t = d t d t ~ d d t ( q a ( t ) + Δ q a ( t ) ) − q ˙ a ( t ) (5.50) \Delta\dot q^a(t):=\frac{\mathrm d \tilde q^a(\tilde t)}{\mathrm d\tilde t}-\frac{\mathrm dq^a(t)}{\mathrm dt}=
\frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t)
\tag{5.50}
Δ q ˙ a ( t ) := d t ~ d q ~ a ( t ~ ) − d t d q a ( t ) = d t ~ d t d t d ( q a ( t ) + Δ q a ( t )) − q ˙ a ( t ) ( 5.50 )
带入式(5.49),展开并保留到一阶小量,得到
Δ q ˙ a ( t ) = d t d t ~ d d t ( q a ( t ) + Δ q a ( t ) ) − q ˙ a ( t ) = ( 1 − d ( δ s t ) d t ~ ) d d t ( q a + δ s q a + δ s t q ˙ a ) − q ˙ a = d d t ( δ s q a ) + δ s t q ¨ a (5.51) \begin{aligned}
\Delta \dot q^a(t)&=\frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t)\\
&=\left(1-\frac{\mathrm d(\delta_st)}{\mathrm d\tilde t} \right)\frac{\mathrm d}{\mathrm dt}(q^a+\delta_sq^a+\delta_st\dot q^a)-\dot q^a\\
&=\frac{\mathrm d}{\mathrm dt}(\delta_sq^a)+\delta_st\ddot q^a
\end{aligned}
\tag{5.51}
Δ q ˙ a ( t ) = d t ~ d t d t d ( q a ( t ) + Δ q a ( t )) − q ˙ a ( t ) = ( 1 − d t ~ d ( δ s t ) ) d t d ( q a + δ s q a + δ s t q ˙ a ) − q ˙ a = d t d ( δ s q a ) + δ s t q ¨ a ( 5.51 )
注意 Δ q ˙ a ≠ d d t ( Δ q a ) \Delta \dot q^a\neq\frac{\mathrm d}{\mathrm dt}(\Delta q^a) Δ q ˙ a = d t d ( Δ q a ) 。
5.5.3 作用量的对称性
在式(5.44)和(5.55)的变换下,作用量的变换定义为
Δ S : = S ~ [ q ~ ] − S [ q ] = ∫ t ~ 1 t ~ 2 d t ~ L ( t ~ , q ~ , d q ~ d t ~ ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) (5.52) \begin{aligned}
\Delta S:&=\tilde S[\boldsymbol{\tilde {q}}]-S[\boldsymbol q]\\
&=\int _{\tilde t_1}^{\tilde t_2}\mathrm d\tilde tL(\tilde t,\tilde {\boldsymbol q},\frac{\mathrm d\tilde{\boldsymbol q}}{\mathrm d\tilde t})-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})
\end{aligned}
\tag{5.52}
Δ S : = S ~ [ q ~ ] − S [ q ] = ∫ t ~ 1 t ~ 2 d t ~ L ( t ~ , q ~ , d t ~ d q ~ ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) ( 5.52 )
若要求作用量在变换下严格不变,则 Δ S ≡ 0 \Delta S\equiv 0 Δ S ≡ 0 。但根据 5.4.1 节的讨论,两个作用量可以在相差边界项的意义下等价,即给出相同的运动方程。因此如果
Δ S = ∫ t 1 t 2 d t d F d t (5.53) \Delta S=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm dF}{\mathrm dt}\tag{5.53}
Δ S = ∫ t 1 t 2 d t d t d F ( 5.53 )
则变换被称作对称变换(symmetry transformation),而称作用量在此变换下不变 (invariant)。此时系统所有的性质在此变换下不变,又因为变换参数可以连续取值,所以对称性被称作连续对称性 (continuous symmetry)。需要强调的是,我们只是在讨论变换 δ s t \delta_s t δ s t 和 δ s q a \delta_s q^a δ s q a 导致变换量形式的改变,而完全没有管运动方程是否满足(即 q a ( t ) q^a(t) q a ( t ) 的函数形式如何)。无论运动方程是否满足,式(5.53)都必须成立,这样的变换才是系统的一个对称性。这体现了对称性式系统的内在属性,与运动方程是否满足(真实运动)没有关系。
在无穷小变换式(5.46)和(5.48)下,利用式(5.49)和(5.51),将 Δ S \Delta S Δ S 展开并保留到一阶小量
Δ S = ∫ t 1 t 2 d t d t ~ d t L ~ ( t ~ , q ~ ( t ~ ) , d q ~ ( t ~ ) d t ~ ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( 1 + δ s t d t ) L ~ ( t + δ s t , q + δ s q + δ s t q ˙ , q ˙ + d ( δ s q ) d t + ( δ s t ) q ¨ ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( 1 + d ( δ s t ) d t ) [ L + ∂ L ∂ t δ s t + ∂ L ∂ q a ( δ s q a + δ s t q ˙ a ) + ∂ L ∂ q ˙ a ( d ( δ s q a ) d t + ( δ s t ) q ¨ a ) ] − ∫ t 1 t 2 d t L = ∫ t 1 t 2 d t [ ∂ L ∂ q a δ s q a + ∂ L ∂ q ˙ a d ( δ s q a ) d t ⏟ = d d t ( ∂ L ∂ q ˙ a δ s q a ) − d d t ∂ L ∂ q ˙ a δ s q a + L d ( δ s t ) d t + ( ∂ L ∂ t + ∂ L ∂ q a q ˙ a + ∂ L ∂ q ˙ a q ¨ a ) ⏟ = d L d t δ s t ] (5.54) \begin{aligned}
\Delta S&=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm d\tilde t}{\mathrm dt}\tilde L(\tilde t,\tilde{\boldsymbol q}(\tilde t),\frac{\mathrm d\tilde{\boldsymbol q}(\tilde t)}{\mathrm d\tilde t})
-\int _{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\
&=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\delta_s t}{\mathrm dt} \right)\tilde L\left(t+\delta_st,\boldsymbol q+\delta_s\boldsymbol q+\delta_st\dot{\boldsymbol q},\dot{\boldsymbol q}+\frac{\mathrm d(\delta_s \boldsymbol q)}{\mathrm dt}+(\delta_st)\ddot{\boldsymbol q}\right)-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\
&=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\mathrm d(\delta_s t)}{\mathrm dt} \right)\left[ L+\frac{\partial L}{\partial t}\delta_st+\frac{\partial L}{\partial q^a}(\delta_sq^a+\delta_st\dot q^a)\right.
\quad \left.+\frac{\partial L}{\partial \dot q^a}\left(\frac{\mathrm d(\delta_s q^a)}{\mathrm dt}+(\delta_st)\ddot q^a \right) \right]-\int_{t_1}^{t_2}\mathrm dtL\\
&=\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial q^a}\delta_sq^a+\underbrace{\frac{\partial L}{\partial \dot q^a}\frac{\mathrm d(\delta_sq^a)}{\mathrm dt}}_{=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a \right)-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\delta_sq^a} +L\frac{\mathrm d(\delta_st)}{\mathrm dt}+\underbrace{\left(\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a \right)}_{=\frac{\mathrm dL}{\mathrm dt}}\delta_s t\right]\\
\end{aligned}
\tag{5.54}
Δ S = ∫ t 1 t 2 d t d t d t ~ L ~ ( t ~ , q ~ ( t ~ ) , d t ~ d q ~ ( t ~ ) ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( 1 + d t δ s t ) L ~ ( t + δ s t , q + δ s q + δ s t q ˙ , q ˙ + d t d ( δ s q ) + ( δ s t ) q ¨ ) − ∫ t 1 t 2 d t L ( t , q , q ˙ ) = ∫ t 1 t 2 d t ( 1 + d t d ( δ s t ) ) [ L + ∂ t ∂ L δ s t + ∂ q a ∂ L ( δ s q a + δ s t q ˙ a ) + ∂ q ˙ a ∂ L ( d t d ( δ s q a ) + ( δ s t ) q ¨ a ) ] − ∫ t 1 t 2 d t L = ∫ t 1 t 2 d t ∂ q a ∂ L δ s q a + = d t d ( ∂ q ˙ a ∂ L δ s q a ) − d t d ∂ q ˙ a ∂ L δ s q a ∂ q ˙ a ∂ L d t d ( δ s q a ) + L d t d ( δ s t ) + = d t d L ( ∂ t ∂ L + ∂ q a ∂ L q ˙ a + ∂ q ˙ a ∂ L q ¨ a ) δ s t ( 5.54 )
整理得到
Δ S = ∫ t 1 t 2 d t [ ( ∂ L ∂ q a − d d t ∂ L ∂ q ˙ a ) δ s q a + d d t ( ∂ L ∂ q ˙ a δ s q a + L δ s t ) ] (5.55) \Delta S=\int_{t_1}^{t_2}\mathrm dt\left[\left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) \right]\tag{5.55}
Δ S = ∫ t 1 t 2 d t [ ( ∂ q a ∂ L − d t d ∂ q ˙ a ∂ L ) δ s q a + d t d ( ∂ q ˙ a ∂ L δ s q a + L δ s t ) ] ( 5.55 )
式(5.55)即是在变换下,作用量的变换。根据对称变换的定义式(5.53),即要求
( ∂ L ∂ q a − d d t ∂ L ∂ q ˙ a ) δ s q a + d d t ( ∂ L ∂ q ˙ a δ s q a + L δ s t ) = d F d t (5.56) \left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) =\frac{\mathrm dF}{\mathrm dt} \tag{5.56}
( ∂ q a ∂ L − d t d ∂ q ˙ a ∂ L ) δ s q a + d t d ( ∂ q ˙ a ∂ L δ s q a + L δ s t ) = d t d F ( 5.56 )
这里的 F F F 与具体的对称变换有关。式(5.56)是在变换式(5.46)和(5.47)下作用量不变,即使对称变换的充分必要条件,被称为诺特条件 (Noether condition)。
在式(5.56)中,第二项已经是时间全导数的形式,特别是时间变换 δ s t \delta_s t δ s t 的贡献总是对时间全导数的形式。所以式(5.56)成立仅对 δ s q a \delta_sq^a δ s q a 的形式做出要求。第一项的 ∂ L ∂ q a − d d t ∂ L ∂ q ˙ a ≡ δ S δ q a \frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\equiv \frac{\delta S}{\delta q^a} ∂ q a ∂ L − d t d ∂ q ˙ a ∂ L ≡ δ q a δ S 对于欧拉-拉格朗日方程。于是式(5.56)可以改写成更方便也更有意义的形式
− δ S δ q a δ s q a = d Q d t (5.57) -\frac{\delta S}{\delta q^a}\delta_s q^a=\frac{\mathrm d\mathcal Q}{\mathrm dt}\tag{5.57}
− δ q a δ S δ s q a = d t d Q ( 5.57 )
这里
Q : = p a δ s q a + L δ s t − F (5.58) \mathcal Q:=p_a\delta_sq^a+L\delta_st-F \tag{5.58}
Q := p a δ s q a + L δ s t − F ( 5.58 )
其中 p a p_a p a 为广义动量。诺特条件可以写成其他等价形式,例如利用式(5.49),式(5.58)还可以写成
Q = p a Δ q a − h δ s t − F (5.59) \mathcal Q=p_a\Delta q^a-h\delta_st-F\tag{5.59}
Q = p a Δ q a − h δ s t − F ( 5.59 )
其中 h ≡ ∂ L ∂ q ˙ a q ˙ a − L h\equiv \frac{\partial L}{\partial \dot q^a}\dot q^a-L h ≡ ∂ q ˙ a ∂ L q ˙ a − L 即能量函数。
5.6 诺特定理
5.6.1 诺特定理的证明
现在假设已经找到了作用量的一个对称变换,当运动方程满足的时候,式(5.57)的左边为零,于是得到
d Q d t ≡ − δ S δ q a δ s q a = 满足运动方程时 0 (5.60) \frac{\mathrm d\mathcal Q}{\mathrm dt}\equiv-\frac{\delta S}{\delta q^a}\delta_sq^a\xlongequal{满足运动方程时}0 \tag{5.60}
d t d Q ≡ − δ q a δ S δ s q a 满足运动方程时 0 ( 5.60 )
亦即
d Q d t = 0 (5.61) \frac{\mathrm d\mathcal Q}{\mathrm dt}=0\tag{5.61}
d t d Q = 0 ( 5.61 )
从而
Q = ∂ L ∂ q ˙ a δ s q a + L δ s t − F = c o n s t (5.62) Q=\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_s t-F=const \tag{5.62}
Q = ∂ q ˙ a ∂ L δ s q a + L δ s t − F = co n s t ( 5.62 )
注意 Q Q Q 和对称变换的参数有关,因此 Q Q Q 本身还不是运动常数,因为运动常数定义为时间、广义坐标和广义速度的函数。
但是有一个特殊,当变换参数与时间参数 t t t 无关时,变换被称作整体变换 (global transformation)。在单参数情形,即有
δ s t = ϵ η ( t , q , q ˙ ) (5.63) \delta_st=\epsilon\eta(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.63}
δ s t = ϵη ( t , q , q ˙ ) ( 5.63 )
δ s q a = ϵ ξ a ( t , q , q ˙ ) , a = 1 , ⋯ , s (5.64) \delta_sq^a=\epsilon\xi^a(t,\boldsymbol q,\dot{\boldsymbol q}),\quad a=1,\cdots,s \tag{5.64}
δ s q a = ϵ ξ a ( t , q , q ˙ ) , a = 1 , ⋯ , s ( 5.64 )
其中 ϵ \epsilon ϵ 是和时间参数 t t t 无关的无穷小常数,η \eta η 和 ξ a \xi^a ξ a 则一般是时间 t t t 、广义坐标及广义速度的函数。相应的边界项记为
F = ϵ φ ( t , q , q ˙ ) (5.65) F=\epsilon\varphi(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.65}
F = ϵ φ ( t , q , q ˙ ) ( 5.65 )
对于整体对称性,因为变换参数 ϵ \epsilon ϵ 是常数,可以将其提出,定义
Q : = 1 ϵ Q = 1 ϵ ( ∂ L ∂ q ˙ a ϵ ξ a + L ϵ η − ϵ φ ) (5.66) Q:=\frac 1\epsilon \mathcal Q=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot q^a}\epsilon \xi^a+L\epsilon \eta-\epsilon \varphi \right) \tag{5.66}
Q := ϵ 1 Q = ϵ 1 ( ∂ q ˙ a ∂ L ϵ ξ a + L ϵη − ϵ φ ) ( 5.66 )
式(5.62)即意味着
Q ≡ ∂ L ∂ q ˙ a ξ a + L η − φ = c o n s t (5.67) Q\equiv \frac{\partial L}{\partial \dot q^a}\xi^a+L\eta-\varphi=const \tag{5.67}
Q ≡ ∂ q ˙ a ∂ L ξ a + L η − φ = co n s t ( 5.67 )
其是之和时间、广义坐标和广义速度有关的运动常数。式(5.67)对多个参数情形的推广是直接的。
从而我们得到诺特定理 (Noether’s theorem):若系统的作用量具有连续整体对称性,则当运动方程满足时,存在相应的运动常数。注意诺特定理成立的前提有三:
(1)对称性是连续对称性,所以才有无穷小变换的概念;
(2)对称性是整体对称性,即变换参数是常数(与 t t t 无关);
(3)运动常数只存在于满足运动方程的真实演化过程中。
5.6.2 时空对称性
考虑 N N N 个粒子的系统,空间坐标的无穷小整体平移即
δ ξ x ( α ) = ϵ ξ ^ (5.68) \delta_{\boldsymbol\xi}\boldsymbol x_{(\alpha)}=\epsilon\hat{\boldsymbol\xi}\tag{5.68}
δ ξ x ( α ) = ϵ ξ ^ ( 5.68 )
其中 ξ ^ \hat{\boldsymbol \xi} ξ ^ 是常单位矢量。因为只是空间坐标的平移,时间参数不变所以 δ s t = 0 \delta_s t=0 δ s t = 0 。同时拉格朗日量严格不变,所以边界项 F = 0 F=0 F = 0 。由式(5.68)得到运动常数
Q = ∑ α = 1 N ∂ L ∂ x ˙ ( α ) ⋅ ξ ^ = ∑ α = 1 N p ( α ) ⋅ ξ ^ = c o n s t (5.69) Q=\sum_{\alpha=1}^{N}\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot\hat{\boldsymbol \xi}=\sum_{\alpha=1}^N \boldsymbol p_{(\alpha)}\cdot\hat{\boldsymbol \xi}=const \tag{5.69}
Q = α = 1 ∑ N ∂ x ˙ ( α ) ∂ L ⋅ ξ ^ = α = 1 ∑ N p ( α ) ⋅ ξ ^ = co n s t ( 5.69 )
即总动量在 ξ ^ \hat{\boldsymbol \xi} ξ ^ 方向的分量守恒。
同样,空间坐标的无穷小整体转动即
δ ξ x ( α ) = ϕ n × x ( α ) (5.70) \delta_{\boldsymbol \xi}\boldsymbol x_{(\alpha)}=\phi\boldsymbol n\times \boldsymbol x_{(\alpha)} \tag{5.70}
δ ξ x ( α ) = ϕ n × x ( α ) ( 5.70 )
其中 ϕ \phi ϕ 为无穷小转角。和整体平移的情形一样,有 δ s t = 0 \delta_st=0 δ s t = 0 ,F = 0 F=0 F = 0 。代入式(5.67)得到运动常数
Q = ∑ α = 1 N ∂ L ∂ x ˙ ( α ) ⋅ ( n × x ( α ) ) = ∑ α = 1 N n ⋅ ( x ( α ) × p ( α ) ) = c o n s t (5.71) Q=\sum_{\alpha=1}^N\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot(\boldsymbol n\times \boldsymbol x_{(\alpha)})=\sum_{\alpha=1}^N\boldsymbol n\cdot\left(\boldsymbol x_{(\alpha)}\times\boldsymbol p_{(\alpha)} \right)=const\tag{5.71}
Q = α = 1 ∑ N ∂ x ˙ ( α ) ∂ L ⋅ ( n × x ( α ) ) = α = 1 ∑ N n ⋅ ( x ( α ) × p ( α ) ) = co n s t ( 5.71 )
即总角动量在 n \boldsymbol n n 方向的分量守恒。
时间的无穷小整体平移对应
δ s t = η (5.72) \delta_st=\eta\tag{5.72}
δ s t = η ( 5.72 )
其中 η \eta η 为无穷小常数。假设广义坐标式时间变换下的标量,
q a ( t ) → q ~ a ( t ~ ) ≡ q a ( t ) (5.73) q^a(t)\to\tilde q^a(\tilde t)\equiv q^a(t)\tag{5.73}
q a ( t ) → q ~ a ( t ~ ) ≡ q a ( t ) ( 5.73 )
即 Δ q a = 0 \Delta q^a=0 Δ q a = 0 ,由式(5.49)得到
δ s q a = − η q ˙ a (5.74) \delta_sq^a=-\eta\dot q^a\tag{5.74}
δ s q a = − η q ˙ a ( 5.74 )
要求作用量严格不变所以 F = 0 F=0 F = 0 。代入式(5.67)得到运动常数
Q = ∂ L ∂ q ˙ a ( − q ˙ a ) + L = − h = c o n s t (5.75) Q=\frac{\partial L}{\partial \dot q^a}(-\dot q^a)+L=-h=const \tag{5.75}
Q = ∂ q ˙ a ∂ L ( − q ˙ a ) + L = − h = co n s t ( 5.75 )
即能量守恒。
Example 5.13 一维阻尼谐振子的运动常数
一维阻尼谐振子的运动方程可以由拉格朗日量 L = e λ t ( 1 2 m q ˙ 2 − 1 2 m ω 2 q 2 ) L=e^{\lambda t}\left(\frac12 m\dot q^2-\frac12m\omega^2q^2\right) L = e λ t ( 2 1 m q ˙ 2 − 2 1 m ω 2 q 2 ) 得到,其中 λ \lambda λ 为常数。考虑变换
t → t ~ = t + α , q ( t ) → q ~ ( t ~ ) = e − λ α 2 q ( t ) (5.76) t\to\tilde t=t+\alpha,\quad q(t)\to \tilde q(\tilde t)=e^{-\frac{\lambda \alpha}{2}}q(t)\tag{5.76}
t → t ~ = t + α , q ( t ) → q ~ ( t ~ ) = e − 2 λ α q ( t ) ( 5.76 )
其中 α \alpha α 是常数。可以验证,在此变换下
S ~ [ q ~ ] = ∫ t ~ 1 t ~ 2 d t ~ e λ t ~ [ 1 2 m ( d q ~ ( t ~ ) d t ~ ) 2 − 1 2 m ω 2 q ~ 2 ] = ∫ t 1 t 2 d t e λ ( t + α ) ( 1 2 m e − λ α q ˙ 2 − 1 2 m ω 2 e − λ α q 2 ) = ∫ t 1 t @ d t e λ t ( 1 2 m q ˙ 2 − 1 2 m ω 2 q 2 ) ≡ S [ q ] \begin{aligned}
\tilde S[\tilde q]&=\int_{\tilde t_1}^{\tilde t_2} \mathrm d\tilde te^{\lambda\tilde t}\left[\frac12m\left(\frac{\mathrm d\tilde q(\tilde t)}{\mathrm d\tilde t}\right)^2-\frac12m\omega^2\tilde q^2 \right]\\
&=\int_{t_1}^{t_2}\mathrm dte^{\lambda(t+\alpha)}\left(\frac12me^{-\lambda\alpha}\dot q^2-\frac12m\omega^2e^{-\lambda\alpha}q^2 \right)\\
&=\int_{t_1}^{t_@}\mathrm dte^{\lambda t}\left(\frac12m\dot q^2-\frac12m\omega^2q^2 \right)\equiv S[q]
\end{aligned}
S ~ [ q ~ ] = ∫ t ~ 1 t ~ 2 d t ~ e λ t ~ [ 2 1 m ( d t ~ d q ~ ( t ~ ) ) 2 − 2 1 m ω 2 q ~ 2 ] = ∫ t 1 t 2 d t e λ ( t + α ) ( 2 1 m e − λ α q ˙ 2 − 2 1 m ω 2 e − λ α q 2 ) = ∫ t 1 t @ d t e λ t ( 2 1 m q ˙ 2 − 2 1 m ω 2 q 2 ) ≡ S [ q ]
其作用量严格不变。因为变换参数 α \alpha α 是常数,所以变换式(5.76)是系统的整体对称性,为了应用诺特定理,首先令 α → ϵ \alpha\to \epsilon α → ϵ 为无穷小参数,得到无穷小变换
t → t ~ = t + ϵ , q ( t ) → q ~ ( t ~ ) = q ( t ) − ϵ λ 2 q ( t ) t\to\tilde t=t+\epsilon,\quad q(t)\to\tilde q(\tilde t)=q(t)-\epsilon\frac \lambda2 q(t)
t → t ~ = t + ϵ , q ( t ) → q ~ ( t ~ ) = q ( t ) − ϵ 2 λ q ( t )
即
δ s t = ϵ , Δ q = − ϵ λ 2 q \delta_s t=\epsilon,\quad \Delta q=-\epsilon\frac\lambda 2q
δ s t = ϵ , Δ q = − ϵ 2 λ q
由式(5.49)又得到
δ s q = Δ q − δ s t q ˙ = − ϵ λ 2 q − ϵ q ˙ \delta_sq=\Delta q-\delta_st\dot q=-\epsilon\frac \lambda 2q-\epsilon \dot q
δ s q = Δ q − δ s t q ˙ = − ϵ 2 λ q − ϵ q ˙
于是对应式(5.73)和(5.74)即
η = 1 , ξ = − λ 2 q − q ˙ \eta=1,\quad \xi=-\frac \lambda 2q-\dot q
η = 1 , ξ = − 2 λ q − q ˙
因为作用量严格不变,所以边界项 φ ≡ 0 \varphi\equiv0 φ ≡ 0 。代入式(5.77)中得到运动常数
Q = ∂ L ∂ q ˙ ( − λ 2 q − q ˙ ) + L = e λ t m q ˙ ( − λ 2 − q ˙ ) + e λ t ( 1 2 m q ˙ 2 − 1 2 m ω 2 q 2 ) = − e λ t 2 ( m q ˙ 2 + m λ q q ˙ + m ω 2 q 2 ) \begin{aligned}
Q&=\frac{\partial L}{\partial \dot q}\left(-\frac\lambda 2q-\dot q\right)+L=e^{\lambda t}m\dot q\left(-\frac\lambda 2-\dot q \right)+e^{\lambda t}\left(\frac 12m\dot q^2-\frac 12m\omega^2q^2 \right)\\
&=-\frac{e^{\lambda t}}{2}\left(m\dot q^2+m\lambda q\dot q+m\omega^2q^2 \right)
\end{aligned}
Q = ∂ q ˙ ∂ L ( − 2 λ q − q ˙ ) + L = e λ t m q ˙ ( − 2 λ − q ˙ ) + e λ t ( 2 1 m q ˙ 2 − 2 1 m ω 2 q 2 ) = − 2 e λ t ( m q ˙ 2 + mλ q q ˙ + m ω 2 q 2 )
Example 5.12 整体 U ( 1 ) \mathrm U(1) U ( 1 ) 对称性
平面上运动的粒子的拉格朗日量为 L = 1 2 m ( x ˙ 2 + y ˙ 2 ) − λ 2 ( x 2 + y 2 ) L=\frac 12m(\dot x^2+\dot y^2)-\frac \lambda 2(x^2+y^2) L = 2 1 m ( x ˙ 2 + y ˙ 2 ) − 2 λ ( x 2 + y 2 ) 。定义 ϕ = x + i y \phi=x+\mathbf i y ϕ = x + i y 和 ϕ ∗ = x − i y \phi^*=x-\mathbf iy ϕ ∗ = x − i y ,则拉格朗日量可以写成 L = 1 2 m ∣ ϕ ˙ ∣ 2 − λ 2 ∣ ϕ ∣ 2 L=\frac 12m|\dot \phi|^2-\frac{\lambda}{2}|\phi|^2 L = 2 1 m ∣ ϕ ˙ ∣ 2 − 2 λ ∣ ϕ ∣ 2 。考虑变换
ϕ → ϕ ~ = e i α ϕ , ϕ ∗ → ϕ ~ ∗ = e − i α ϕ ∗ (5.77) \phi\to\tilde\phi=e^{\mathbf i\alpha}\phi,\quad \phi^{*}\to\tilde\phi^*=e^{-\mathbf i\alpha}\phi^*\tag{5.77}
ϕ → ϕ ~ = e i α ϕ , ϕ ∗ → ϕ ~ ∗ = e − i α ϕ ∗ ( 5.77 )
其中 α \alpha α 是常数。式(5.77)是相位的变换,数学上构成所谓 U ( 1 ) \mathrm U(1) U ( 1 ) 群。在变换下
L → L ~ = 1 2 m ∣ ϕ ~ ˙ ∣ 2 − λ 2 ∣ ϕ ~ ∣ 2 ≡ L L\to\tilde L=\frac 12m|\dot{\tilde\phi}|^2-\frac{\lambda}{2}|\tilde \phi|^2 \equiv L
L → L ~ = 2 1 m ∣ ϕ ~ ˙ ∣ 2 − 2 λ ∣ ϕ ~ ∣ 2 ≡ L
即拉格朗日量是不变的。又因 α \alpha α 是常数,所以式(5.77)是系统的整体 U ( 1 ) \mathrm U(1) U ( 1 ) 对称性。为了应用诺特定理,令 α → ϵ \alpha \to \epsilon α → ϵ 为无穷小参数,无穷小变换即为
δ s ϕ = i ϵ ϕ , δ s ϕ ∗ = − i ϵ ϕ ∗ \delta_s\phi=\mathbf i\epsilon \phi,\quad \delta_s\phi^*=-\mathbf i\epsilon \phi^*
δ s ϕ = i ϵ ϕ , δ s ϕ ∗ = − i ϵ ϕ ∗
变换不涉及时间的变换,所以 δ s t = 0 \delta_st=0 δ s t = 0 。同时拉格朗日量严格不变,所以边界项 φ = 0 \varphi=0 φ = 0 。代入式(5.67)中,得到运动常数
Q ≡ ∂ L ∂ ϕ ˙ i ϕ + ∂ L ∂ ϕ ˙ ∗ ( − i ϕ ∗ ) = i m ( ϕ ˙ ∗ ϕ − ϕ ˙ ϕ ∗ ) Q\equiv\frac{\partial L}{\partial \dot\phi}\mathbf i\phi+\frac{\partial L}{\partial \dot \phi^*}(-\mathbf i\phi^*)=\mathbf im(\dot \phi^*\phi-\dot \phi\phi^*)
Q ≡ ∂ ϕ ˙ ∂ L i ϕ + ∂ ϕ ˙ ∗ ∂ L ( − i ϕ ∗ ) = i m ( ϕ ˙ ∗ ϕ − ϕ ˙ ϕ ∗ )
为了看出这一运动常数的物理意义,将 ϕ \phi ϕ 和 ϕ ∗ \phi^* ϕ ∗ 代回直角坐标 x x x 和 y y y ,得到
i m ( ϕ ˙ ∗ ϕ − ϕ ˙ ϕ ∗ ) = i m [ ( x ˙ − i y ˙ ) ( x + i y ) − ( x ˙ + i y ˙ ) ( x − i y ) ] = 2 m ( x y ˙ − y x ˙ ) \mathbf im(\dot\phi^*\phi-\dot\phi\phi^*)=\mathbf im[(\dot x-\mathbf i\dot y)(x+\mathbf iy)-(\dot x+\mathbf i\dot y)(x-\mathbf iy)]=2m(x\dot y-y\dot x)
i m ( ϕ ˙ ∗ ϕ − ϕ ˙ ϕ ∗ ) = i m [( x ˙ − i y ˙ ) ( x + i y ) − ( x ˙ + i y ˙ ) ( x − i y )] = 2 m ( x y ˙ − y x ˙ )
这里的 m ( x y ˙ − y x ˙ ) m(x\dot y-y\dot x) m ( x y ˙ − y x ˙ ) 的物理意义正是粒子绕原点的角动量。整体 U ( 1 ) \mathrm U(1) U ( 1 ) 对称性正对应 2 维平面上的转动不变性,所以自然有角动量守恒。
Example 5.13 动力学对称
考虑 D D D 维欧氏空间中各向同性谐振子,取直角坐标 { x i } \{x^i\} { x i } ,拉格朗日量维 L = 1 2 m x 2 ˙ − 1 2 m ω 2 x 2 L=\frac12m\dot{\boldsymbol x^2}-\frac 12m\omega^2\boldsymbol x^2 L = 2 1 m x 2 ˙ − 2 1 m ω 2 x 2 。这一拉格朗日量当然具有时间平移和坐标整体转动的不变性。除此之外,其还具有额外的对称性。考虑无穷小变换
δ ( k l ) x i = ϵ 1 2 ( x ˙ k δ l i + x ˙ l δ k i ) , i = 1 , ⋯ , D (5.78) \delta_{(kl)} x^i=\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta^i_k),\quad i=1,\cdots,D\tag{5.78}
δ ( k l ) x i = ϵ 2 1 ( x ˙ k δ l i + x ˙ l δ k i ) , i = 1 , ⋯ , D ( 5.78 )
这里 ϵ \epsilon ϵ 为变换参数; k , l k,l k , l 为给定指标,即对于每个 k , l k,l k , l 的值,都有一个相应的变换,因为变换参数 ϵ \epsilon ϵ 是常数,所以这个变换是整体变换。对式(5.78)求时间导数有
δ ( k l ) x ˙ i = ϵ 1 2 ( x ¨ k δ l i + x ¨ l δ k i ) , i = 1 , ⋯ , D \delta_{(kl)}\dot x^i=\epsilon\frac12(\ddot x_k\delta_{l}^i+\ddot x_l\delta_k^i),\quad i=1,\cdots,D
δ ( k l ) x ˙ i = ϵ 2 1 ( x ¨ k δ l i + x ¨ l δ k i ) , i = 1 , ⋯ , D
于是在这个变换下
δ ( k l ) ( x ˙ 2 ) = 2 x ˙ i δ ( k l ) x i = ϵ x ˙ i ( x ¨ k δ l i + x ¨ l δ k i ) = ϵ ( x ˙ l x ¨ k + x ˙ k x ¨ l ) = ϵ d d t ( x ˙ k x ˙ l ) \delta_{(kl)}(\dot{\boldsymbol x}^2)=2\dot x_i\delta_{(kl)}x^i=\epsilon \dot x_i(\ddot x_k\delta_l^i+\ddot x_l\delta_k^i)=\epsilon(\dot x_l\ddot x_k+\dot x_k\ddot x_l)=\epsilon\frac{\mathrm d}{\mathrm dt}(\dot x_k\dot x_l)
δ ( k l ) ( x ˙ 2 ) = 2 x ˙ i δ ( k l ) x i = ϵ x ˙ i ( x ¨ k δ l i + x ¨ l δ k i ) = ϵ ( x ˙ l x ¨ k + x ˙ k x ¨ l ) = ϵ d t d ( x ˙ k x ˙ l )
同样
δ ( k l ) ( x 2 ) = 2 x i δ k l x i = ϵ x i ( x ˙ k δ l i + x ˙ l δ k i ) = ϵ d d t ( x k x l ) \delta_{(kl)}(\boldsymbol x^2)=2x_i\delta_{kl}x^i=\epsilon x_i(\dot x_k\delta_l^i+\dot x_l\delta_k^i)=\epsilon \frac{\mathrm d}{\mathrm dt}(x_kx_l)
δ ( k l ) ( x 2 ) = 2 x i δ k l x i = ϵ x i ( x ˙ k δ l i + x ˙ l δ k i ) = ϵ d t d ( x k x l )
于是作用量的变换为
Δ ( k l ) S = ∫ d t ( 1 2 m δ ( k l ) ( x ˙ 2 ) − 1 2 m ω 2 δ ( k l ) ( x 2 ) ) = ∫ d t ϵ d d t ( 1 2 m x ˙ k x ˙ l − 1 2 m ω 2 x k x l ) \begin{aligned}
\Delta_{(kl)}S&=\int \mathrm dt\left(\frac 12m\delta_{(kl)}(\dot{\boldsymbol x}^2)-\frac 12m\omega^2\delta_{(kl)}(\boldsymbol x^2) \right)\\
&=\int \mathrm dt\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac12m\dot x_k\dot x_l-\frac 12m\omega^2 x_kx_l\right)
\end{aligned}
Δ ( k l ) S = ∫ d t ( 2 1 m δ ( k l ) ( x ˙ 2 ) − 2 1 m ω 2 δ ( k l ) ( x 2 ) ) = ∫ d t ϵ d t d ( 2 1 m x ˙ k x ˙ l − 2 1 m ω 2 x k x l )
可见在变换式(5.78)下,作用量不变,且得到非零边界项
F ( k l ) = ϵ ( 1 2 m x ˙ l x ˙ l − 1 2 m ω 2 x k x l ) F_{(kl)}=\epsilon(\frac12m\dot x_l\dot x_l-\frac 12m\omega^2x_kx_l)
F ( k l ) = ϵ ( 2 1 m x ˙ l x ˙ l − 2 1 m ω 2 x k x l )
变换不涉及时间,所以 δ s t ≡ 0 \delta_s t\equiv0 δ s t ≡ 0 。根据诺特定理,存在运动常数
Q ( k l ) = 1 ϵ ( ∂ L ∂ x ˙ i δ ( k l ) x i − F ( k l ) ) = 1 ϵ [ m x ˙ i ϵ 1 2 ( x ˙ k δ l i + x ˙ l δ k i ) − ϵ ( 1 2 m x ˙ k x ˙ l − 1 2 m ω 2 x k x l ) ] = 1 2 m x ˙ k x ˙ l + 1 2 m ω 2 x k x l \begin{aligned}
Q_{(kl)}&=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot x^i}\delta_{(kl)}x^i-F_{(kl)} \right)\\
&=\frac 1\epsilon\left[m\dot x_i\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta_k^i)-\epsilon(\frac 12m\dot x_k\dot x_l-\frac12 m\omega^2x_kx_l) \right]\\
&=\frac 12m\dot x_k\dot x_l+\frac 12m\omega^2x_kx_l
\end{aligned}
Q ( k l ) = ϵ 1 ( ∂ x ˙ i ∂ L δ ( k l ) x i − F ( k l ) ) = ϵ 1 [ m x ˙ i ϵ 2 1 ( x ˙ k δ l i + x ˙ l δ k i ) − ϵ ( 2 1 m x ˙ k x ˙ l − 2 1 m ω 2 x k x l ) ] = 2 1 m x ˙ k x ˙ l + 2 1 m ω 2 x k x l
Q ( k l ) Q_{(kl)} Q ( k l ) 对于 k , l k,l k , l 指标对称,对于 D D D 维空间,有 1 2 D ( D + 1 ) \frac 12D(D+1) 2 1 D ( D + 1 ) 个独立分量。变换式(5.78)不是时间和空间坐标纯几何的变换,特别是变换中涉及速度,被称为动力学对称 (dynamical symmetry)。在这个简单的例子中,变换式(5.78)对应哈密顿量在幺正变换的不变性。
5.6.3 标度对称性
物理学中还有一种重要的整体对称性,即变量的整体缩放
t → t ~ = e β t , q a ( t ) → = q ~ ( t ~ ) = e α q a ( t ) (5.79) t\to \tilde t=e^\beta t,\quad q^a(t)\to=\tilde q(\tilde t)=e^\alpha q^a(t) \tag{5.79}
t → t ~ = e β t , q a ( t ) →= q ~ ( t ~ ) = e α q a ( t ) ( 5.79 )
其中 α , β \alpha,\beta α , β 是无量纲的常数,被称作标度变换 (scale transformation)。恒等变换即对应 α = β = 0 \alpha=\beta=0 α = β = 0 。标度变换相当于选取不同的单位(即标度)来衡量物理量。如果物理系统的作用量在标度变换下不变,则称其有标度不变性。
对于定常系统,由式(4.47)作用量为
S [ q ] = ∫ d t ( 1 2 G a b ( q ) q ˙ a q ˙ b − V ( q ) ) (5.80) S[\boldsymbol q]=\int \mathrm dt\left(\frac 12G_{ab}(\boldsymbol q)\dot q^a\dot q^b-V(\boldsymbol q) \right)\tag{5.80}
S [ q ] = ∫ d t ( 2 1 G ab ( q ) q ˙ a q ˙ b − V ( q ) ) ( 5.80 )
在标度变换式(5.79)下,作用量变换为
S ~ [ q ~ ] = ∫ d t ~ ( 1 2 G a b ( q ~ ) d q ~ a d t ~ d q ~ b d t ~ − V ( q ~ ) ) = ∫ d t e β ( 1 2 G a b ( e α q ) e 2 ( α − β ) q ˙ a q ˙ b − V ( e α q ) ) \begin{aligned}
\tilde S[\tilde{\boldsymbol q}]&=\int \mathrm d\tilde t\left(\frac 12G_{ab}(\tilde{\boldsymbol q})\frac{\mathrm d\tilde q^a}{\mathrm d\tilde t}\frac{\mathrm d\tilde q^b}{\mathrm d\tilde t}-V(\tilde{\boldsymbol q}) \right)\\
&=\int \mathrm dte^\beta\left(\frac{1}2G_{ab}(e^\alpha\boldsymbol q)e^{2(\alpha-\beta)}\dot q^a\dot q^b- V(e^\alpha\boldsymbol q)\right)
\end{aligned}
S ~ [ q ~ ] = ∫ d t ~ ( 2 1 G ab ( q ~ ) d t ~ d q ~ a d t ~ d q ~ b − V ( q ~ ) ) = ∫ d t e β ( 2 1 G ab ( e α q ) e 2 ( α − β ) q ˙ a q ˙ b − V ( e α q ) )
一般来说作用量并没有标度不变性。如果 G a b ( q ) G_{ab}(\boldsymbol q) G ab ( q ) 和 V ( q ) V(\boldsymbol q) V ( q ) 都是广义坐标的齐次函数 (homogeneous function),即对于任意常数 λ \lambda λ ,
G a b ( λ q ) = λ k G a b ( q ) , V ( λ q ) = λ p V ( q ) (5.81) G_{ab}(\lambda \boldsymbol q)=\lambda^kG_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.81}
G ab ( λ q ) = λ k G ab ( q ) , V ( λ q ) = λ p V ( q ) ( 5.81 )
其中 k , p k,p k , p 是常数,于是
S ~ = ∫ d t ( 1 2 G a b ( q ) e ( 2 + k ) α − β q ˙ a q ˙ b − e p α + β V ( q ) ) \tilde S=\int \mathrm dt\left(\frac12G_{ab}(\boldsymbol q)e^{(2+k)\alpha-\beta}\dot q^a\dot q^b-e^{p\alpha+\beta}V(\boldsymbol q) \right)
S ~ = ∫ d t ( 2 1 G ab ( q ) e ( 2 + k ) α − β q ˙ a q ˙ b − e p α + β V ( q ) )
作用量不变要求
( 2 + k ) α − β = 0 , p α + β = 0 (5.82) (2+k)\alpha-\beta=0,\quad p\alpha+\beta=0\tag{5.82}
( 2 + k ) α − β = 0 , p α + β = 0 ( 5.82 )
从中得到 k , p k,p k , p 满足的条件
2 + k + p = 0 (5.83) 2+k+p=0 \tag{5.83}
2 + k + p = 0 ( 5.83 )
总之,定常系统式(5.80)具有标度不变性要求
G a b ( λ q ) = 1 λ 2 + p G a b ( q ) , V ( λ q ) = λ p V ( q ) (5.84) G_{ab}(\lambda \boldsymbol q)=\frac {1}{\lambda^{2+p}}G_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.84}
G ab ( λ q ) = λ 2 + p 1 G ab ( q ) , V ( λ q ) = λ p V ( q ) ( 5.84 )
其中 p p p 为常数,由式(5.83)的第二式,相应的标度变换为
t → t ~ = e − p α t , q a ( t ) → q ~ a ( t ~ ) = e α q a ( t ) (5.85) t\to\tilde t=e^{-p\alpha}t,\quad q^a(t)\to\tilde q^a(\tilde t)=e^\alpha q^a(t) \tag{5.85}
t → t ~ = e − p α t , q a ( t ) → q ~ a ( t ~ ) = e α q a ( t ) ( 5.85 )
其中 α \alpha α 是常数。
Exercise 5.10
已知非相对论极限下磁场中带电粒子的拉格朗日量为 L = 1 2 m v 2 + e c v ⋅ A L=\frac{1}{2}m\boldsymbol v^2+\frac{e}{c}\boldsymbol v\cdot \boldsymbol A L = 2 1 m v 2 + c e v ⋅ A ,其中 c c c 是光速, e e e 是电荷, v ≡ x ˙ \boldsymbol v\equiv \dot{\boldsymbol x} v ≡ x ˙ 是粒子的速度, A \boldsymbol A A 是失势。假设 A = 1 2 B × x \boldsymbol A=\frac 12\boldsymbol B\times \boldsymbol x A = 2 1 B × x ,其中 B = B e z \boldsymbol B=B\boldsymbol e_z B = B e z 是 z z z 方向的均匀磁场。
(1)求粒子的运动方程,证明其具有 v ˙ = v × ω \dot{\boldsymbol v}=\boldsymbol v\times \boldsymbol \omega v ˙ = v × ω 的形式。
(2)写出拉格朗日量在柱坐标 { r , ϕ , z } \{r,\phi,z\} { r , ϕ , z } 中的形式,证明虽然 ϕ \phi ϕ 是循环坐标,但是角动量的 z z z 分量 J z ≡ m r 2 ϕ ˙ J_z\equiv mr^2\dot \phi J z ≡ m r 2 ϕ ˙ 却并不是运动常数,并解释其原因。
proof
(1)
d d t ∂ L ∂ v i − ∂ L ∂ x i = d d t ( m v i + e c A i ) − e c v j ⋅ ∂ A j ∂ x i = m v ¨ i + e c v j ( ∂ A i ∂ x j − ∂ A j ∂ x i ) = 0 (5.86) \begin{aligned}
\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial v^i}-\frac{\partial L}{\partial x^i}&=\frac{\mathrm d}{\mathrm dt}( mv_i+\frac{e}{c}A_i)-\frac{e}{c}v^j\cdot\frac{\partial A_j}{\partial x^i} \\
&=m\ddot v_i+\frac{e}{c}v^j\left(\frac{\partial A_i}{\partial x^j}-\frac{\partial A_j}{\partial x^i} \right)=0
\end{aligned}
\tag{5.86}
d t d ∂ v i ∂ L − ∂ x i ∂ L = d t d ( m v i + c e A i ) − c e v j ⋅ ∂ x i ∂ A j = m v ¨ i + c e v j ( ∂ x j ∂ A i − ∂ x i ∂ A j ) = 0 ( 5.86 )
因为 B k = ( ∇ × A ) k = ϵ k m n ∂ m A n \boldsymbol B^k=(\nabla \times\boldsymbol A)^k=\epsilon^{kmn}\partial_mA_n B k = ( ∇ × A ) k = ϵ kmn ∂ m A n ,因此
ϵ i j k B k = ϵ i j k ϵ k m n ∂ m A n = ( δ i m δ j n − δ i n δ j m ) ∂ m A n = ∂ A j ∂ x i − ∂ A i ∂ x j \epsilon_{ijk}B^k=\epsilon_{ijk}\epsilon^{kmn}\partial_mA_n=(\delta_i^m\delta_j^n-\delta_i^n\delta_j^m)\partial_mA_n=\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}
ϵ ijk B k = ϵ ijk ϵ kmn ∂ m A n = ( δ i m δ j n − δ i n δ j m ) ∂ m A n = ∂ x i ∂ A j − ∂ x j ∂ A i
所以式(5.87)可以写成
m v ¨ i = e c ϵ i j k v j B k m\ddot v_i=\frac{e}{c}\epsilon_{ijk}v^jB^k
m v ¨ i = c e ϵ ijk v j B k
即
m v ¨ = v × e c B m\ddot{\boldsymbol v}=\boldsymbol v\times \frac{e}{c}\boldsymbol B
m v ¨ = v × c e B
(2)
v 2 = r ˙ 2 + r 2 ϕ ˙ 2 + z ˙ 2 v ⋅ A = 1 2 B e z ⋅ ( v × x ) = 1 2 B r 2 ϕ ˙ \boldsymbol v^2=\dot r^2+r^2\dot \phi^2+\dot z^2\\
\boldsymbol v\cdot \boldsymbol A=\frac 12 B\boldsymbol e_z\cdot(\boldsymbol v\times \boldsymbol x)=\frac 12 Br^2\dot\phi
v 2 = r ˙ 2 + r 2 ϕ ˙ 2 + z ˙ 2 v ⋅ A = 2 1 B e z ⋅ ( v × x ) = 2 1 B r 2 ϕ ˙
所以
L = 1 2 m ( r ˙ 2 + r 2 ϕ ˙ 2 + z ˙ 2 ) − e 2 c B r 2 ϕ ˙ L=\frac{1}{2}m(\dot r^2+r^2\dot\phi ^2+\dot z^2)-\frac{e}{2c}Br^2\dot\phi
L = 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 + z ˙ 2 ) − 2 c e B r 2 ϕ ˙
显然 ϕ \phi ϕ 是循环坐标。
p ϕ = ∂ L ∂ ϕ = m r 2 ϕ ˙ − e 2 c B r 2 = c o n s t p_{\phi}=\frac{\partial L}{\partial \phi}=mr^2\dot\phi-\frac{e}{2c}Br^2=const
p ϕ = ∂ ϕ ∂ L = m r 2 ϕ ˙ − 2 c e B r 2 = co n s t
所以角动量的 z z z 分量 J z J_z J z 不是运动常数。因为洛伦兹力会产生力矩。
Chapter 6 辅助变量
6.1 拉格朗日乘子法
对于有约束的系统,虽然作用量的变分仍是
δ S [ q ] ≃ − ∫ d t ( d d t ∂ L ∂ q ˙ a − ∂ L ∂ q a ) δ q a \delta S[\boldsymbol q]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a
δ S [ q ] ≃ − ∫ d t ( d t d ∂ q ˙ a ∂ L − ∂ q a ∂ L ) δ q a
但是由于 δ q a \delta q^a δ q a 不是相互独立,所以无法确定出 s s s 个独立的运动方程。对于这样的已知约束的系统,有一个标准且有效的处理方法,即拉格朗日乘子法 (method of Lagrange multipliers)。
6.1.1 函数的条件极值
对于二元函数 F = F ( x , y ) F=F(x,y) F = F ( x , y ) ,以及约束 ϕ ( x , y ) = 0 \phi(x,y)=0 ϕ ( x , y ) = 0 。F F F 取极值的条件为
d F = ∂ F ∂ x d x + ∂ F ∂ y d y = 0 (6.1) \mathrm dF=\frac{\partial F}{\partial x}\mathrm dx+\frac{\partial F}{\partial y}\mathrm dy=0\tag{6.1}
d F = ∂ x ∂ F d x + ∂ y ∂ F d y = 0 ( 6.1 )
∇ F = − λ ∇ ϕ (6.2) \nabla F=-\lambda\nabla \phi \tag{6.2}
∇ F = − λ ∇ ϕ ( 6.2 )
其中 λ \lambda λ 为常数,即拉格朗日乘子 (Largrange multiplier)。由此问题可以转化为 3 元函数
F ~ ( x , y , λ ) ≡ F ( x , y ) + λ ϕ ( x , y ) (6.3) \tilde F(x,y,\lambda)\equiv F(x,y)+\lambda\phi(x,y)\tag{6.3}
F ~ ( x , y , λ ) ≡ F ( x , y ) + λ ϕ ( x , y ) ( 6.3 )
在将 x , y , λ x,y,\lambda x , y , λ 视为 3 个独立变量的情况下的极值条件,即
d F ~ = ∂ F ~ ∂ x d x + ∂ F ~ ∂ y d y + ∂ F ~ ∂ ϕ d ϕ = ( ∂ F ∂ x + λ ∂ ϕ ∂ x ) d x + ( ∂ F ∂ y + λ ∂ ϕ ∂ y ) d y + ϕ d λ (6.4) \mathrm d\tilde F=\frac{\partial \tilde F}{\partial x}\mathrm dx+\frac{\partial \tilde F}{\partial y}\mathrm dy+\frac{\partial \tilde F}{\partial \phi}\mathrm d\phi=\left(\frac{\partial F}{\partial x}+\lambda\frac{\partial \phi}{\partial x} \right)\mathrm dx+\left(\frac{\partial F}{\partial y}+\lambda\frac{\partial \phi}{\partial y} \right)\mathrm dy+\phi\mathrm d\lambda\tag{6.4}
d F ~ = ∂ x ∂ F ~ d x + ∂ y ∂ F ~ d y + ∂ ϕ ∂ F ~ d ϕ = ( ∂ x ∂ F + λ ∂ x ∂ ϕ ) d x + ( ∂ y ∂ F + λ ∂ y ∂ ϕ ) d y + ϕ d λ ( 6.4 )
6.1.2 完整约束
简单起见,只考虑存在 1 个完整约束的情形,约束方程为
ϕ ( t , q ) = 0 (6.5) \phi(t,\boldsymbol q)=0 \tag{6.5}
ϕ ( t , q ) = 0 ( 6.5 )
对于多个完整约束的推广是直接的。完整约束式(6.5)诱导出广义坐标变分之间的关系
δ ϕ = ∂ ϕ ∂ q a δ q a (6.6) \delta \phi=\frac{\partial \phi}{\partial q^a}\delta q^a \tag{6.6}
δ ϕ = ∂ q a ∂ ϕ δ q a ( 6.6 )
由于泛函导数 δ S δ q a \frac{\delta S}{\delta q^a} δ q a δ S 相当于作用量 S S S 在位形空间中的“梯度”,因此取极值时应该有
δ S δ q a = − λ ∂ ϕ ∂ q a , a = 1 , ⋯ , s (6.7) \frac{\delta S}{\delta q^a}=-\lambda \frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.7}
δ q a δ S = − λ ∂ q a ∂ ϕ , a = 1 , ⋯ , s ( 6.7 )
这里的拉格朗日乘子 λ ( t ) \lambda(t) λ ( t ) 一般也是时间参数 t t t 的函数,但是和 { q } \{\boldsymbol q\} { q } 及 { q ˙ } \{\dot{\boldsymbol q}\} { q ˙ } 无关。得到"“拓展”"后的作用量
S ~ [ λ , q ] = ∫ d t [ L ( t , q , q ˙ ) + λ ( t ) ϕ ( t , q ) ] \tilde S[\lambda,\boldsymbol q]=\int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q) \right]
S ~ [ λ , q ] = ∫ d t [ L ( t , q , q ˙ ) + λ ( t ) ϕ ( t , q ) ]
写出对于的 s + 1 s+1 s + 1 个欧拉-拉格朗日方程:
d d t ∂ L ~ ∂ q ˙ a − ∂ L ~ ∂ q a = d d t ∂ L ∂ q ˙ a − ∂ L ∂ q a − λ ∂ ϕ ∂ q a , a = 1 , ⋯ , s (6.8) \frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot q^a}-\frac{\partial \tilde L}{\partial q^a}=\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}-\lambda\frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.8}
d t d ∂ q ˙ a ∂ L ~ − ∂ q a ∂ L ~ = d t d ∂ q ˙ a ∂ L − ∂ q a ∂ L − λ ∂ q a ∂ ϕ , a = 1 , ⋯ , s ( 6.8 )
d d t ∂ L ~ ∂ λ ˙ − ∂ L ~ ∂ λ = − ϕ = 0 (6.9) \frac{\mathrm d}{\mathrm dt}\frac{\partial\tilde L}{\partial \dot \lambda}-\frac{\partial \tilde L}{\partial \lambda}=-\phi=0 \tag{6.9}
d t d ∂ λ ˙ ∂ L ~ − ∂ λ ∂ L ~ = − ϕ = 0 ( 6.9 )
与多元函数情形一样,将拉格朗日乘子 λ \lambda λ 视为一个独立变量,其运动方程就是约束方程。
Example 6.2 用拉格朗日乘子法求解二维球面上的自由粒子
考虑半径为 R R R 的球面,一粒子约束在球面上运动,忽略摩擦和重力。这个问题中粒子的自由度为 2 ,可以直接取球面坐标 { θ , ϕ } \{\theta,\phi \} { θ , ϕ } 。这里我们取 3 维直角坐标,约束即
ϕ ( x , y , z ) = x 2 + y 2 + z 2 − R 2 = 0 \phi(x,y,z)=x^2+y^2+z^2-R^2=0
ϕ ( x , y , z ) = x 2 + y 2 + z 2 − R 2 = 0
为完整约束。应用拉格朗日乘子法写出作用量
S [ x , y , z , λ ] = ∫ d t [ 1 2 m ( x ˙ 2 + y ˙ 2 + z ˙ 2 ) − λ ( x 2 + y 2 + z 2 − R 2 ) ] S[x,y,z,\lambda]=\int\mathrm dt\left[\frac 12m(\dot x^2+\dot y^2+\dot z^2)-\lambda(x^2+y^2+z^2-R^2) \right]
S [ x , y , z , λ ] = ∫ d t [ 2 1 m ( x ˙ 2 + y ˙ 2 + z ˙ 2 ) − λ ( x 2 + y 2 + z 2 − R 2 ) ]
变分得到 x , y , z x,y,z x , y , z 的运动方程
m x ¨ − 2 λ x = 0 , m y ¨ − 2 λ y = 0 , m z ¨ − 2 λ z = 0 m\ddot x-2\lambda x=0,\quad m\ddot y-2\lambda y=0,\quad m\ddot z-2\lambda z=0
m x ¨ − 2 λ x = 0 , m y ¨ − 2 λ y = 0 , m z ¨ − 2 λ z = 0
以及约束方程 ϕ ( x , y , z ) = 0 \phi(x,y,z)=0 ϕ ( x , y , z ) = 0 ,一共 4 个方程,对应 4 个未知变量,可以得到 x ¨ x = y ¨ y = z ¨ z = 2 λ m \frac{\ddot x}{x}=\frac{\ddot y}{y}=\frac{\ddot z}{z}=\frac{2\lambda}{m} x x ¨ = y y ¨ = z z ¨ = m 2 λ ,因为 x , y , z x,y,z x , y , z 都是独立变量,其成立条件当且仅当拉格朗日乘子 λ \lambda λ 取常数。
对约束式求时间导数得到
ϕ ˙ = 2 x x ˙ + 2 y y ˙ + 2 z z ˙ = 2 x ⋅ x ˙ = 0 \dot \phi=2x\dot x+2y\dot y+2z\dot z=2\boldsymbol x\cdot\dot{\boldsymbol x}=0
ϕ ˙ = 2 x x ˙ + 2 y y ˙ + 2 z z ˙ = 2 x ⋅ x ˙ = 0
上式意味粒子的速度切于球面。上式再求时间导数得到 x ˙ 2 + x ⋅ x ¨ = 0 \dot {\boldsymbol x}^2+\boldsymbol x\cdot \ddot {\boldsymbol x}=0 x ˙ 2 + x ⋅ x ¨ = 0 ,代入前面的式子中得到
x ˙ 2 = − 2 λ m R 2 \dot{\boldsymbol x}^2=-\frac{2\lambda}{m}R^2
x ˙ 2 = − m 2 λ R 2
根据上面分析, $\lambda $ 为常数,使上式有意义必须要求 λ < 0 \lambda \lt 0 λ < 0 。实际上,上式即 E ≡ 1 2 m x ˙ 2 = − λ R 2 E\equiv \frac 12m\dot{\boldsymbol x}^2=-\lambda R^2 E ≡ 2 1 m x ˙ 2 = − λ R 2 。在 3 维直角坐标下,粒子有 3 个自由度,状态空间由 { x , v } \{\boldsymbol x,\boldsymbol v\} { x , v } 共 6 个变量描述。球面给出这 6 个变量的 3 个约束 x 2 = R 2 \boldsymbol x^2=R^2 x 2 = R 2 , x ⋅ x ˙ = 0 \boldsymbol x\cdot \dot{\boldsymbol x}=0 x ⋅ x ˙ = 0 和 v 2 = 2 E m \boldsymbol{v}^2=\frac{2E}{m} v 2 = m 2 E ,其中能量 E E E 待定,因此独立变量的个数为 6 + 1 − 3 = 4 6+1-3=4 6 + 1 − 3 = 4 ,这与球面上粒子的自由度为 1 2 × 4 = 2 \frac 12\times 4=2 2 1 × 4 = 2 也是自洽的。
6.1.3 非完整约束
由以上讨论知,拉格朗日乘子法的关键在于约束可以视为位形空间中的曲面,从而给出如式(6.6)的广义坐标变分的线性关系。这对于非完整系统一般是不成立的,因此拉格朗日乘子法一般不能推广到非完整系统。对于形如 ϕ ( t , q , q ˙ ) = 0 \phi(t,\boldsymbol q,\dot{\boldsymbol q})=0 ϕ ( t , q , q ˙ ) = 0 的非完整约束,写出作用量
∫ d t [ L ( t , q , q ˙ ) + λ ( t ) ϕ ( t , q , q ˙ ) ] (6.10) \int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q,\dot{\boldsymbol q}) \right] \tag{6.10}
∫ d t [ L ( t , q , q ˙ ) + λ ( t ) ϕ ( t , q , q ˙ ) ] ( 6.10 )
并将 { q } \{\boldsymbol q\} { q } 和 λ \lambda λ 视为独立变量做变分,并不能得到非完整系统正确的运动方程,即作用量式(6.10)并不能正确描述非完整系统。实际上,一般的非完整系统并不能纳入最小作用量的框架内。
一个例外是当非完整约束具有如下形式
ϕ ( t , q , q ˙ ) = A a ( t , q ) q ˙ a + B ( t , q ) = 0 (6.11) \phi(t,\boldsymbol q,\dot{\boldsymbol q})=A_a(t,\boldsymbol q)\dot q^a+B(t,\boldsymbol q)=0\tag{6.11}
ϕ ( t , q , q ˙ ) = A a ( t , q ) q ˙ a + B ( t , q ) = 0 ( 6.11 )
即只包含广义速度的“线性项”时,拉格朗日乘子法也是适用的。这是因为式(6.11)意味着 ϕ d t = A a d q a + B d t \phi \mathrm dt=A_a\mathrm dq^a+B\mathrm dt ϕ d t = A a d q a + B d t 。在任一瞬时(d t = 0 \mathrm dt=0 d t = 0 ),广义坐标的变分即满足关系
A a d q a = 0 (6.12) A_a\mathrm dq^a=0\tag{6.12}
A a d q a = 0 ( 6.12 )
这具有和式(6.6)同样的形式,只是式(6.6)中的“梯度” ∂ ϕ ∂ q a \frac{\partial \phi}{\partial q^a} ∂ q a ∂ ϕ 被换成了一般的“矢量” A a A_a A a 。仿照完整约束的思路,即要求泛函的梯度 δ S δ q a \frac{\delta S}{\delta q^a} δ q a δ S 与 A a A_a A a 成正比
δ S δ q a = − λ A a (6.13) \frac{\delta S}{\delta q^a}=-\lambda A_a\tag{6.13}
δ q a δ S = − λ A a ( 6.13 )
等价的,即要求
∫ d ( δ L + λ A a δ q a ) = 0 (6.14) \int \mathrm d\left(\delta L+\lambda A_a\delta q^a \right)=0\tag{6.14}
∫ d ( δ L + λ A a δ q a ) = 0 ( 6.14 )
即得到运动方程
d d t ∂ L ∂ q ˙ a − ∂ L ∂ q a = − λ A a . a = 1 , ⋯ , s (6.15) \frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}=-\lambda A_a.\quad a=1,\cdots ,s\tag{6.15}
d t d ∂ q ˙ a ∂ L − ∂ q a ∂ L = − λ A a . a = 1 , ⋯ , s ( 6.15 )
完整约束的式(6.8)可以认为是式(6.15)中 A a → ∂ ϕ ∂ q a A_a\to \frac{\partial \phi}{\partial q^a} A a → ∂ q a ∂ ϕ 的特殊情况。
还有一种非完整约束是以积分形式给出的,例如
∫ d t ϕ ( t , q , q ˙ ) = C = c o n s t (6.16) \int \mathrm dt\phi(t,\boldsymbol q,\dot {\boldsymbol q})=C=const \tag{6.16}
∫ d tϕ ( t , q , q ˙ ) = C = co n s t ( 6.16 )
这类约数被称为等周约束 (isoperimetric constraint)。等周约束也可以用拉格朗日乘子法处理。这是因为等周约束式(6.18)的积分是一个常数,而作用量加上常数不影响极值,所以
S 取极值 ⟺ ( S + λ ∫ d t ϕ ) 取极值 (6.17) S取极值 \iff \left(S+\lambda\int\mathrm dt\phi\right)取极值\tag{6.17}
S 取极值 ⟺ ( S + λ ∫ d tϕ ) 取极值 ( 6.17 )
这里拉格朗日乘子法 λ \lambda λ 必须是个常数。因此,对于等周约束式(6.16),应用拉格朗日乘子法即相当于对于扩展的作用量
S ~ [ q ] = ∫ d t ( L + λ ϕ ) = ∫ d t ( L ( t , q , q ˙ ) + λ ϕ ( t , q , q ˙ ) ) (6.18) \tilde S[\boldsymbol q]=\int \mathrm dt(L+\lambda\phi)=\int \mathrm dt(L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda\phi(t,\boldsymbol q,\dot{\boldsymbol q})) \tag{6.18}
S ~ [ q ] = ∫ d t ( L + λ ϕ ) = ∫ d t ( L ( t , q , q ˙ ) + λ ϕ ( t , q , q ˙ )) ( 6.18 )
在将 { q } \{\boldsymbol q\} { q } 全部视为独立的情况下,求变分极值。对于等周约束,拉格朗日乘子法 $\lambda $ 是个常数(其值待定),不参与变分。
Example 6.5 包围最大面积的定长封闭曲线为圆周
取平面直角坐标,平面上的曲线参数化为 x = x ( s ) , y = y ( s ) x=x(s),y=y(s) x = x ( s ) , y = y ( s ) ,这里 s s s 是曲线的参数。封闭曲线所围面积为
A = 1 2 ∮ C ( x d y − y d x ) = 1 2 ∮ C d s ( x y ˙ − y x ˙ ) A=\frac 12\oint_C(x\mathrm dy-y\mathrm dx)=\frac 12\oint_C\mathrm ds(x\dot y-y\dot x)
A = 2 1 ∮ C ( x d y − y d x ) = 2 1 ∮ C d s ( x y ˙ − y x ˙ )
这里 x ˙ ≡ d x d s , y ˙ ≡ d y d s \dot x\equiv \frac{\mathrm dx}{\mathrm ds},\dot y\equiv\frac{\mathrm dy}{\mathrm ds} x ˙ ≡ d s d x , y ˙ ≡ d s d y 。设曲线长度固定为 C C C ,对于的等周约束即
∮ C d x 2 + d y 2 = ∮ C d s x ˙ 2 + y ˙ 2 = C \oint_C\sqrt{\mathrm dx^2+\mathrm dy^2}=\oint_C \mathrm ds\sqrt{\dot x^2+\dot y^2}=C
∮ C d x 2 + d y 2 = ∮ C d s x ˙ 2 + y ˙ 2 = C
于是拉格朗日乘子法要求泛函
A + λ C = ∮ C d s [ 1 2 ( x y ˙ − y x ˙ ) + λ x ˙ 2 + y ˙ 2 ] A+\lambda C=\oint _C\mathrm ds\left[\frac 12(x\dot y-y\dot x)+\lambda\sqrt{\dot x^2+\dot y^2} \right]
A + λ C = ∮ C d s [ 2 1 ( x y ˙ − y x ˙ ) + λ x ˙ 2 + y ˙ 2 ]
在将 x x x 和 y y y 视为独立变量的情况下取极值。对 x x x 变分得到方程(注意 λ \lambda λ 为常数)
y ˙ − λ d d s ( x ˙ x ˙ 2 + y ˙ 2 = 0 ) ⇒ y − λ x ˙ x ˙ 2 + y ˙ 2 = y 0 \dot y-\lambda\frac{\mathrm d}{\mathrm ds}\left(\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=0 \right)\quad \Rightarrow\quad y-\lambda\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=y_0
y ˙ − λ d s d ( x ˙ 2 + y ˙ 2 x ˙ = 0 ) ⇒ y − λ x ˙ 2 + y ˙ 2 x ˙ = y 0
同理,对 y y y 变分得到
x − λ y ˙ x ˙ 2 + y ˙ 2 = x 0 x-\lambda \frac{\dot y}{\sqrt{\dot x^2+\dot y^2}}=x_0
x − λ x ˙ 2 + y ˙ 2 y ˙ = x 0
这里 x 0 x_0 x 0 和 y 0 y_0 y 0 是常数。由上两式可以得到 ( x − x 0 ) 2 + ( y − y 0 ) 2 = λ 2 (x-x_0)^2+(y-y_0)^2=\lambda^2 ( x − x 0 ) 2 + ( y − y 0 ) 2 = λ 2 ,这是一个以 ( x 0 , y 0 ) (x_0,y_0) ( x 0 , y 0 ) 为圆心,半径为 λ \lambda λ 的圆。拉格朗日乘子法亦即半径 λ \lambda λ 的值由等周约束方程给出。
Example 6.6 最大熵概率分布
孤立系统在平衡态的概率分布是的系统的熵取极大值,被称作最大熵概率分布 (maximum entropy probability distribution)。假设系统处于某个能量 E E E 的概率密度为 ρ ( E ) \rho(E) ρ ( E ) ,则系统的熵为 S [ ρ ] = ∫ d E ρ ln ρ S[\rho]=\int \mathrm dE\rho\ln \rho S [ ρ ] = ∫ d Eρ ln ρ 。孤立系统需要满足两个约束条件:其一是总能量守恒,∫ d E ρ E = E = c o n s t \int \mathrm dE\rho E=\Epsilon=const ∫ d EρE = E = co n s t ;其二是概率密度的归一化条件, ∫ d E ρ = 1 \int \mathrm dE\rho=1 ∫ d Eρ = 1 。两个约束条件以积分形式出现,可视为等周约束。因此,使得熵取极值的概率分布即要求泛函
S ~ [ ρ ] = ∫ d E ρ ln ρ + β ∫ d E ρ E + λ ∫ d E ρ \tilde S[\rho]=\int \mathrm dE\rho\ln \rho+\beta\int \mathrm dE\rho E+\lambda\int \mathrm dE\rho
S ~ [ ρ ] = ∫ d Eρ ln ρ + β ∫ d EρE + λ ∫ d Eρ
取极值,这里 β \beta β 和 λ \lambda λ 为拉格朗日乘子,都是常数。对 ρ \rho ρ 变分得到 δ S ~ = ∫ d R ( ln ρ + 1 + β E + λ ) δ ρ = 0 \delta \tilde S=\int \mathrm dR(\ln \rho+1+\beta E+\lambda)\delta \rho=0 δ S ~ = ∫ d R ( ln ρ + 1 + βE + λ ) δ ρ = 0 ,从中解出 ρ = e − λ − 1 e − β E \rho=e^{-\lambda-1}e^{-\beta E} ρ = e − λ − 1 e − βE 。这正是著名的玻尔兹曼分布 (Boltzmann distribution)。
Chapter 7 微分变分原理
7.1 达朗贝尔原理
7.1.1 虚位移与虚功
按照牛顿力学的观念,一切影响运动的因素都归结为力。既然运动被约束限制,这种限制自然也归结为所谓约束力 (constraint force),即迫使力学系统遵循约束条件的力。相应地,和约束无关的力(即约束消失仍然存在)被称为主动力 (applied force)。约束力这个概念虽然很直接,却带来了技术上的复杂性。运动方程中1的约束力不能预先确定,是未知量的一部分,只能用运动方程和约束方程联合求解。
作为一种变分原理,达朗贝尔原理将广义坐标的变分称作虚位移 (virtual displacement),即系统在任意的瞬时,满足约束条件的无穷小位移。力(包括主动力和约束力)在虚位移下所做的功即虚功 (virtual work)。考虑 N N N 个粒子构成的粒子系统。第 α \alpha α 个粒子受到的主动力记为 F ( α ) \boldsymbol F_{(\alpha)} F ( α ) ,约束力记为 N ( α ) \boldsymbol N_{(\alpha)} N ( α ) 。则第 α \alpha α 个粒子主动力的虚构即 N ( α ) ⋅ δ x ( α ) \boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)} N ( α ) ⋅ δ x ( α ) 。某个粒子的虚位移平行于约束面,约束力则垂直于约束面,即虚位移与约束力总是垂直的 N ⋅ δ x = 0 \boldsymbol N\cdot \delta \boldsymbol x=0 N ⋅ δ x = 0 。受此启发,如果系统所有粒子受约束力所做的虚功之和为零,即
∑ α = 1 N N ( α ) ⋅ δ x ( α ) = 0 (7.1) \sum_{\alpha=1}^N \boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.1}
α = 1 ∑ N N ( α ) ⋅ δ x ( α ) = 0 ( 7.1 )
则该系统的约束称为理想约束 (ideal constraint)。注意,理想约束是系统所受全部约束的一个整体性质,而不是某一个或某几个约束的性质。以下我们只讨论理想约束。
7.1.2 达朗贝尔原理的表述
达朗贝尔原理的出发点是牛顿运动方程。考虑 N N N 个粒子组成的粒子系统。每一个粒子都满足牛顿第二定理 F ( α ) + N ( α ) = m ( α ) x ¨ ( α ) \boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}=m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)} F ( α ) + N ( α ) = m ( α ) x ¨ ( α ) ,即
F ( α ) + N ( α ) − m ( α ) x ¨ ( α ) = 0 , α = 1 , ⋯ , N (7.2) \boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)}=0,\quad \alpha=1,\cdots,N\tag{7.2}
F ( α ) + N ( α ) − m ( α ) x ¨ ( α ) = 0 , α = 1 , ⋯ , N ( 7.2 )
在牛顿力学中, − m ( α ) x ¨ ( α ) -m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} − m ( α ) x ¨ ( α ) 可视为第 α \alpha α 个质点所受的惯性力 (inertial force)。设第 α \alpha α 个粒子的虚位移为 δ x ( α ) \delta \boldsymbol x_{(\alpha)} δ x ( α ) 。将式(7.2)与 δ x ( α ) \delta \boldsymbol x_{(\alpha)} δ x ( α ) 作点乘,并对所有粒子求和,得到
∑ α = 1 N ( F ( α ) + N ( α ) − m ( α ) x ¨ ( α ) ) ⋅ δ x ( α ) = 0 (7.3) \sum_{\alpha=1}^N \left(\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.3}
α = 1 ∑ N ( F ( α ) + N ( α ) − m ( α ) x ¨ ( α ) ) ⋅ δ x ( α ) = 0 ( 7.3 )
而由理想约束条件式(7.1)知,系统约束力总的虚功为零,因此
∑ α = 1 N ( F ( α ) + m ( α ) x ¨ ( α ) ) δ x ( α ) = 0 (7.4) \sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}+m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\delta x_{(\alpha)}=0 \tag{7.4}
α = 1 ∑ N ( F ( α ) + m ( α ) x ¨ ( α ) ) δ x ( α ) = 0 ( 7.4 )
式(7.4)意味着理想约束系统所受主动力和惯性力产生的总虚功为零,这就是达朗贝尔原理 (d’Alembert principle)。在达朗贝尔原理中,约束力在方程中不再出现,从而化简了计算。达朗贝尔原理式(7.4)有一个简单的几何解释。因为虚位移 δ x ( α ) \delta \boldsymbol x_{(\alpha)} δ x ( α ) 总是满足约束,即平行于约束面的,因此式(7.3)相当于牛顿运动方程(7.2)在平行于约束面方向的投影。而理想约束的约束力 N ( α ) \boldsymbol N_{(\alpha)} N ( α ) 可以认为是垂直于约束面的,因此在投影之下自然消失了,即得到式(7.4)。
如果系统已经达到平衡状态,即有 x ( α ) = c o n s t \boldsymbol x_{(\alpha)}=const x ( α ) = co n s t ,因此 x ¨ ( α ) = 0 \ddot{\boldsymbol x}_{(\alpha)}=0 x ¨ ( α ) = 0 。这时,达朗贝尔原理式(7.4)意味着
∑ α = 1 N F ( α ) ⋅ δ x ( α ) = 0 (7.5) \sum_{\alpha=1}^N \boldsymbol F_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0 \tag{7.5}
α = 1 ∑ N F ( α ) ⋅ δ x ( α ) = 0 ( 7.5 )
即系统达到平衡的条件是所有主动力所做虚功之和为零,也被称作虚功原理 (principle pf virtual work)。
Example 7.1 用虚功原理来求解平衡问题
如图所示,四根长度为 l l l 的硬杆用无摩擦的铰链连接,系统的位移由广义坐标 θ \theta θ 完全确定。若左右方向收到力 F 1 F_1 F 1 的挤压,上下方向收到力 F 2 F_2 F 2 的挤压。建立直角坐标,由几何关系 x A = − l cos θ , x B = l cos θ , y C = − l sin θ x_A=-l\cos\theta,x_B=l\cos\theta,y_C=-l\sin\theta x A = − l cos θ , x B = l cos θ , y C = − l sin θ 和 y D = l sin θ y_D=l\sin\theta y D = l sin θ ,则虚功原理要求
0 ≡ δ W A + δ W B + δ W C + δ W D = F 1 δ x A − F 1 δ x B + F 2 δ y C − F 2 δ y D = 2 l ( F 1 sin θ − F 2 cos θ ) δ θ \begin{aligned}
0\equiv &\delta W_A+\delta W_B+\delta W_C+\delta W_D=F_1\delta x_A-F_1\delta x_B+F_2\delta y_C-F_2\delta y_D\\
=&2l\left(F_1\sin\theta-F_2\cos \theta \right)\delta \theta
\end{aligned}
0 ≡ = δ W A + δ W B + δ W C + δ W D = F 1 δ x A − F 1 δ x B + F 2 δ y C − F 2 δ y D 2 l ( F 1 sin θ − F 2 cos θ ) δ θ
即要求 F 1 sin θ − F 2 cos θ = 0 F_1\sin\theta-F_2\cos\theta=0 F 1 sin θ − F 2 cos θ = 0 ,因此达到平衡时满足 θ = arctan F 2 F 1 \theta=\arctan\frac{F_2}{F_1} θ = arctan F 1 F 2 。相比受力分析的做法,用虚功原理可以更便捷地求解平很问题。
7.2 由达朗贝尔原理导出拉格朗日方程
通过达朗贝尔原理,可以将牛顿第二定律改造成拉格朗日方程的形式。由于约束的存在,各个粒子的虚位移 δ x ( α ) \delta \boldsymbol x_{(\alpha)} δ x ( α ) 不独立,所以从式(7.4)并不能得到
F ( α ) − m ( α ) x ¨ ( α ) = 0 , α = 1 , ⋯ , N \boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}=0,\quad \alpha=1,\cdots,N
F ( α ) − m ( α ) x ¨ ( α ) = 0 , α = 1 , ⋯ , N
的结论。因此,首先需要对达朗贝尔原理用独立的广义坐标表达。对于 N N N 个粒子组成的系统,假设存在 k k k 个完整约束,于是可以选取 s = 3 N − k s=3N-k s = 3 N − k 个独立的广义坐标 { q a } , a = 1 , ⋯ , s \{q^a\},a=1,\cdots,s { q a } , a = 1 , ⋯ , s 。第 α \alpha α 个粒子的直角坐标 x ( α ) \boldsymbol x_{(\alpha)} x ( α ) 用广义坐标 { q } \{\boldsymbol q\} { q } 表示为 x ( α ) = x ( α ) ( t , q ) \boldsymbol x_{(\alpha)}=\boldsymbol x_{(\alpha)}(t,\boldsymbol q) x ( α ) = x ( α ) ( t , q ) 。直角坐标的虚位移为
δ x ( α ) = ∂ x ( α ) ∂ q a δ q a , α = 1 , ⋯ , N (7.6) \delta \boldsymbol x_{(\alpha)}=\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a,\quad \alpha=1,\cdots,N \tag{7.6}
δ x ( α ) = ∂ q a ∂ x ( α ) δ q a , α = 1 , ⋯ , N ( 7.6 )
将式(7.6)代入式(7.4)得到
∑ α = 1 N ( F ( α ) − m ( α ) x ¨ ( α ) ) ⋅ ∂ x ( α ) ∂ q a δ q a = 0 \sum_{\alpha=1}^N(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol {\ddot x}_{(\alpha)})\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a=0
α = 1 ∑ N ( F ( α ) − m ( α ) x ¨ ( α ) ) ⋅ ∂ q a ∂ x ( α ) δ q a = 0
s s s 个广义坐标是相互独立的,因此上式的成立要求每一个 δ q a \delta q^a δ q a 前面的系数都为零 ,即得到 s s s 个独立的方程
∑ α = 1 N ( F ( α ) − m ( α ) x ¨ ( α ) ) ∂ x ( α ) ∂ q a = 0 , a = 1 , ⋯ , s \sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=0,\quad a=1,\cdots,s
α = 1 ∑ N ( F ( α ) − m ( α ) x ¨ ( α ) ) ∂ q a ∂ x ( α ) = 0 , a = 1 , ⋯ , s
即
∑ α = 1 N m ( α ) x ¨ ( α ) ⋅ ∂ x ( α ) ∂ q a = ∑ α = 1 N F ( α ) ⋅ ∂ x ( α ) ∂ q a , a = 1 , ⋯ , s (7.7) \sum_{\alpha=1}^N m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a},\quad a=1,\cdots,s\tag{7.7}
α = 1 ∑ N m ( α ) x ¨ ( α ) ⋅ ∂ q a ∂ x ( α ) = α = 1 ∑ N F ( α ) ⋅ ∂ q a ∂ x ( α ) , a = 1 , ⋯ , s ( 7.7 )
其中
左边 = d d t ( ∑ α = 1 N m ( α ) x ˙ ( α ) ⋅ ∂ x ( α ) ∂ q a ) − ∑ α = 1 N m ( α ) x ˙ ( α ) ⋅ d d t ( ∂ x ( α ) ∂ q a ) = d d t ( ∑ α = 1 N m ( α ) x ˙ ( α ) ⋅ ∂ x ( α ) ∂ q a ) − ∑ α = 1 N m ( α ) x ˙ ( α ) ⋅ ∂ x ˙ ( α ) ∂ q a = d d t ∂ ∂ q a ( 1 2 ∑ α = 1 N m ( α ) x ˙ ( α ) 2 ) ⏟ T − ∂ ∂ q a ( 1 2 ∑ α = 1 N m ( α ) x ˙ ( α ) 2 ) ⏟ T \begin{aligned}
左边&=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\mathrm d}{\mathrm dt} \left(\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)\\
&=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot \frac{\partial \boldsymbol {\dot x}_{(\alpha)}}{\partial q^a} \\
&=\frac{\mathrm d}{\mathrm dt}\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}^2_{(\alpha)} \right)}_{T}-\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}^2 \right)}_{T}
\end{aligned}
左边 = d t d ( α = 1 ∑ N m ( α ) x ˙ ( α ) ⋅ ∂ q a ∂ x ( α ) ) − α = 1 ∑ N m ( α ) x ˙ ( α ) ⋅ d t d ( ∂ q a ∂ x ( α ) ) = d t d ( α = 1 ∑ N m ( α ) x ˙ ( α ) ⋅ ∂ q a ∂ x ( α ) ) − α = 1 ∑ N m ( α ) x ˙ ( α ) ⋅ ∂ q a ∂ x ˙ ( α ) = d t d ∂ q a ∂ T ( 2 1 α = 1 ∑ N m ( α ) x ˙ ( α ) 2 ) − ∂ q a ∂ T ( 2 1 α = 1 ∑ N m ( α ) x ˙ ( α ) 2 )
即
左边 = d d t ( ∂ T ∂ q a ) − ∂ T ∂ q a (7.8) 左边=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a}\right)-\frac{\partial T}{\partial q^a}\tag{7.8}
左边 = d t d ( ∂ q a ∂ T ) − ∂ q a ∂ T ( 7.8 )
对于式(7.7)的右边,定义广义力
右边 = ∑ α = 1 N F ( α ) ⋅ ∂ x ( α ) ∂ q a ≡ Q a (7.9) 右边=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv Q_a \tag{7.9}
右边 = α = 1 ∑ N F ( α ) ⋅ ∂ q a ∂ x ( α ) ≡ Q a ( 7.9 )
因为广义坐标不必是长度量纲,所以广义力也不必是力的量纲,最终我们得到一组完全用独立的广义坐标表达的动力学方程
d d t ( ∂ T ∂ q a ) − ∂ T ∂ q a = Q a , a = 1 , ⋯ , s (7.10) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a} \right)-\frac{\partial T}{\partial q^a}=Q_a,\quad a=1,\cdots,s\tag{7.10}
d t d ( ∂ q a ∂ T ) − ∂ q a ∂ T = Q a , a = 1 , ⋯ , s ( 7.10 )
式(7.10)即拉格朗日方程。
7.2.1 保守系统
当系统所受主动力全部都是保守力 (conservative force)时,
F ( α ) = − ∂ V ∂ x ( α ) (7.11) \boldsymbol F_{(\alpha)}=-\frac{\partial V}{\partial \boldsymbol x_{(\alpha)}}\tag{7.11}
F ( α ) = − ∂ x ( α ) ∂ V ( 7.11 )
这里 V = V ( x ( 1 ) , ⋯ , x ( N ) ) ≡ V ( q ) V=V(\boldsymbol x_{(1)},\cdots,\boldsymbol x_{(N)})\equiv V(\boldsymbol q) V = V ( x ( 1 ) , ⋯ , x ( N ) ) ≡ V ( q ) 是势能,只依赖与系统的位形。式(7.10)中的广义力可以写成
Q a = ∑ α = 1 N F ( α ) ⋅ ∂ x ( α ) ∂ q a = − ∑ α = 1 N ∂ V ∂ x ( α ) ⋅ ∂ x ( α ) ∂ q a ≡ ∂ V ∂ q a Q_a=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=-\sum_{\alpha=1}^N\frac{\partial V}{\partial x_{(\alpha)}}\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv\frac{\partial V}{\partial q^a}
Q a = α = 1 ∑ N F ( α ) ⋅ ∂ q a ∂ x ( α ) = − α = 1 ∑ N ∂ x ( α ) ∂ V ⋅ ∂ q a ∂ x ( α ) ≡ ∂ q a ∂ V
代入式(7.10)得到
d d t ( ∂ T ∂ q ˙ a ) − ∂ T ∂ q a = − ∂ V ∂ q a (7.12) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial T}{\partial q^a}=-\frac{\partial V}{\partial q^a}\tag{7.12}
d t d ( ∂ q ˙ a ∂ T ) − ∂ q a ∂ T = − ∂ q a ∂ V ( 7.12 )
即
d d t ( ∂ T ∂ q ˙ a ) − ∂ ( T − V ) ∂ q a = 0 (7.13) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial (T-V)}{\partial q^a}=0\tag{7.13}
d t d ( ∂ q ˙ a ∂ T ) − ∂ q a ∂ ( T − V ) = 0 ( 7.13 )
因为势能与广义速度无关, ∂ T ∂ q ˙ a ≡ ∂ ( T − V ) ∂ q ˙ a \frac{\partial T}{\partial \dot q^a}\equiv\frac{\partial(T-V)}{\partial \dot q^a} ∂ q ˙ a ∂ T ≡ ∂ q ˙ a ∂ ( T − V ) 。因此,若定义 L ≡ T − V L\equiv T-V L ≡ T − V ,式(7.13)可以进一步写成
d d t ( ∂ L ∂ q ˙ a ) − ∂ L ∂ q a = 0 , a = 1 , ⋯ , s (7.14) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a}=0,\quad a=1,\cdots,s\tag{7.14}
d t d ( ∂ q ˙ a ∂ L ) − ∂ q a ∂ L = 0 , a = 1 , ⋯ , s ( 7.14 )
式(7.14)即是完整、保守系统的拉格朗日方程,其中 L ≡ T − V L\equiv T-V L ≡ T − V 即拉格朗日量。这里也再次看出,拉格朗日量为牛顿力学的动能减去势能。
Chapter 8 两体问题
8.1 两体系统
两个相互作用的粒子组成的封闭系统即两体系统。研究两体系统的运动问题即所谓两体问题 (two-body problem)。通常两体问题有严格解。
两体问题可分为三类。一种情况是两个粒子不会无限分离,保持有限距离,被称为束缚态 (bound state)。另一种情况是两个粒子从无穷远处靠近,经相互作用改变彼此的运动状态,之后又相互分离至无穷远,被称作碰撞 (collision)或散射 (scattering)。还有一种情况是两粒子经过相互作用合二为一,或者一个例子一分为二,被称为俘获 (capture)或衰变 (decay)。
8.1.1
设两粒子的质量分别为 m 1 m_1 m 1 和 m 2 m_2 m 2 ,空间位置用直角坐标记为 x 1 \boldsymbol x_1 x 1 和 x 2 \boldsymbol x_2 x 2 。两体系统的动能为
T = 1 2 m 1 x ˙ 1 2 + 1 2 m 2 x ˙ 2 2 (8.1) T=\frac 12m_1\dot {\boldsymbol x}_1^2+\frac 12m_2\dot{\boldsymbol x}_2^2\tag{8.1}
T = 2 1 m 1 x ˙ 1 2 + 2 1 m 2 x ˙ 2 2 ( 8.1 )
相互作用势能为 V = V ( x 1 , x 2 ) V=V(\boldsymbol x_1,\boldsymbol x_2) V = V ( x 1 , x 2 ) ,只和两个粒子的空间位置有关。由空间对称性,可以对势能的形式作进一步的要求,
V ( x 1 , x 2 ) = V ( x 1 − x 2 ) (8.2) V(\boldsymbol x_1,\boldsymbol x_2)=V(\boldsymbol x_1-\boldsymbol x_2)\tag{8.2}
V ( x 1 , x 2 ) = V ( x 1 − x 2 ) ( 8.2 )
即空间均匀性决定相互作用势能只和相对位置有关。如果进一步要求空间是各向同性的,即在任意转动下也不变,则势能具有形式
V ( x 1 − x 2 ) = V ( ∣ x 1 − x 2 ∣ ) (8.3) V(\boldsymbol x_1-\boldsymbol x_2)=V(|\boldsymbol x_1-\boldsymbol x_2|)\tag{8.3}
V ( x 1 − x 2 ) = V ( ∣ x 1 − x 2 ∣ ) ( 8.3 )
即只和两粒子的相对距离大小有关,和方向无关。
总之,在空间均匀和各向同性的要求下,两体系统的拉格朗日量为
L = 1 2 m 1 x ˙ 1 + 1 2 m 2 x ˙ 2 2 − V ( ∣ x 1 − x 2 ∣ ) (8.4) L=\frac 12m_1\dot{\boldsymbol x}_1+\frac 12m_2\dot{\boldsymbol x}_2^2-V(|\boldsymbol x_1-\boldsymbol x_2|) \tag{8.4}
L = 2 1 m 1 x ˙ 1 + 2 1 m 2 x ˙ 2 2 − V ( ∣ x 1 − x 2 ∣ ) ( 8.4 )
对于两体系统,由于相互作用势能 V ( ∣ x 1 − x 2 ∣ ) V(|\boldsymbol x_1-\boldsymbol x_2|) V ( ∣ x 1 − x 2 ∣ ) 的存在,两个粒子之间产生的关系,被称作耦合 (coupled)。
8.1.2 两体系统的退耦
以两体各自的坐标 x 1 , x 2 \boldsymbol x_1,\boldsymbol x_2 x 1 , x 2 为变量,两体系统的运动方程是耦合在一起的,但我们可以选取新的广义坐标使得两体系统退耦 (decoupled),即等效为两个相互独立的单粒子的运动。
考虑与 { x 1 , x 2 } \{\boldsymbol x_1,\boldsymbol x_2\} { x 1 , x 2 } 满足线性关系的一组新的坐标 { y 1 , y 2 } \{\boldsymbol y_1,\boldsymbol y_2\} { y 1 , y 2 } ,线性变换关系为
( x 1 x 2 ) = ( a b c d ) ( y 1 y 2 ) (8.5) \begin{pmatrix}
\boldsymbol x_1\\
\boldsymbol x_2
\end{pmatrix}
=
\begin{pmatrix}
a&b\\
c&d
\end{pmatrix}
\begin{pmatrix}
\boldsymbol y_1\\
\boldsymbol y_2
\end{pmatrix}
\tag{8.5}
( x 1 x 2 ) = ( a c b d ) ( y 1 y 2 ) ( 8.5 )
其中 a , b , c , d a,b,c,d a , b , c , d 为常数。在式(8.5)的变换下,动能项变为
T = 1 2 ( x 1 x 2 ) ( m 1 0 0 m 2 ) ( x 1 x 2 ) = 1 2 ( y 1 y 2 ) ( m 1 a 2 + m 2 c 2 m 1 a b + m 2 c d m 1 a b + m 2 c d m 1 b 2 + m 2 d 2 ) ( y 1 y 2 ) (8.6) \begin{aligned}
T&=\frac 12
\begin{pmatrix}
\boldsymbol x_1 &
\boldsymbol x_2
\end{pmatrix}
\begin{pmatrix}
m_1 & 0\\
0 & m_2
\end{pmatrix}
\begin{pmatrix}
\boldsymbol x_1\\
\boldsymbol x_2
\end{pmatrix}\\
&=\frac 12
\begin{pmatrix}
\boldsymbol y_1 &
\boldsymbol y_2
\end{pmatrix}
\begin{pmatrix}
m_1a^2+m_2c^2 & m_1ab+m_2cd\\
m_1ab+m_2cd & m_1b^2+m_2d^2
\end{pmatrix}
\begin{pmatrix}
\boldsymbol y_1\\
\boldsymbol y_2
\end{pmatrix}
\end{aligned}
\tag{8.6}
T = 2 1 ( x 1 x 2 ) ( m 1 0 0 m 2 ) ( x 1 x 2 ) = 2 1 ( y 1 y 2 ) ( m 1 a 2 + m 2 c 2 m 1 ab + m 2 c d m 1 ab + m 2 c d m 1 b 2 + m 2 d 2 ) ( y 1 y 2 ) ( 8.6 )
如果要求用新的变量 y 1 , y 2 \boldsymbol y_1,\boldsymbol y_2 y 1 , y 2 表达的动能项时退耦的,就必须要求非对角元为零,即
m 1 a b + m 2 c d = 0 (8.7) m_1ab+m_2cd=0\tag{8.7}
m 1 ab + m 2 c d = 0 ( 8.7 )
由式(8.5),相互作用的势能项变为 V = V ( ∣ ( a − c ) y 1 + ( b − d ) y 2 ∣ ) V=V(|(a-c)\boldsymbol y_1+(b-d)\boldsymbol y_2 |) V = V ( ∣ ( a − c ) y 1 + ( b − d ) y 2 ∣ ) 。因此,如果要求势能式退耦的,则只能是 a = c a=c a = c 或 b = d b=d b = d 。不失一般性,不妨取
a = c (8.8) a=c\tag{8.8}
a = c ( 8.8 )
同时满足式(8.7)和(8.8)的线性变换的一般形式为
( y 1 y 2 ) = ( 1 a x c 1 b m 2 m 1 + m 2 r ) (8.9) \begin{pmatrix}
\boldsymbol y_1\\
\boldsymbol y_2
\end{pmatrix}
=
\begin{pmatrix}
\frac 1a\boldsymbol x_c\\
\frac 1b \frac{m_2}{m_1+m_2}\boldsymbol r
\end{pmatrix}
\tag{8.9}
( y 1 y 2 ) = ( a 1 x c b 1 m 1 + m 2 m 2 r ) ( 8.9 )
其中 a , b a,b a , b 为任意常数,这里自然出现了两体系统的质心位置 x c \boldsymbol x_c x c 和两粒子的相对位矢 r \boldsymbol r r ,定义
x c : = m 1 x 1 + m 2 x 2 m 1 + m 2 , r = x 1 − x 2 (8.10) \boldsymbol x_c:=\frac{m_1\boldsymbol x_1+m_2\boldsymbol x_2}{m_1+m_2},\quad \boldsymbol r=\boldsymbol x_1-\boldsymbol x_2\tag{8.10}
x c := m 1 + m 2 m 1 x 1 + m 2 x 2 , r = x 1 − x 2 ( 8.10 )
简单起见,不妨取 a = 1 , b = m 2 m 1 + m 2 a=1,b=\frac{m_2}{m_1+m_2} a = 1 , b = m 1 + m 2 m 2 。即有 y 1 = x c \boldsymbol y_1=\boldsymbol x_c y 1 = x c 和 y 2 = r \boldsymbol y_2=\boldsymbol r y 2 = r 。此时动能项成为
T = 1 2 ( x c r ) ( m t 0 0 m r ) ( x c r ) (8.11) T=\frac12
\begin{pmatrix}
\boldsymbol x_c & \boldsymbol r
\end{pmatrix}
\begin{pmatrix}
m_t & 0 \\
0 & m_r
\end{pmatrix}
\begin{pmatrix}
\boldsymbol x_c
\\ \boldsymbol r
\end{pmatrix}\tag{8.11}
T = 2 1 ( x c r ) ( m t 0 0 m r ) ( x c r ) ( 8.11 )
其中, m t m_t m t 为两体系统的总质量
m t ≡ m 1 + m 2 (8.12) m_t\equiv m_1+m_2 \tag{8.12}
m t ≡ m 1 + m 2 ( 8.12 )
m r m_r m r 被称为约化质量 (reduced mass)
m r ≡ m 1 m 2 m 1 + m 2 (8.13) m_r\equiv\frac{m_1m_2}{m_1+m_2} \tag{8.13}
m r ≡ m 1 + m 2 m 1 m 2 ( 8.13 )
相互作用势能项为 V = V ( ∣ x 1 − x 2 ∣ ) = V ( r ) V=V(|\boldsymbol x_1-\boldsymbol x_2|)=V(r) V = V ( ∣ x 1 − x 2 ∣ ) = V ( r ) ,只是两粒子相对距离,即相对位矢大小 r ≡ ∣ r ∣ r\equiv|\boldsymbol r| r ≡ ∣ r ∣ 的函数,也是完全退耦的。
总之,在空间均匀和各向同性的假设下,两体系统可以完全退耦,即约化为两个单粒子的运动,分别对应两体系统的质心运动与相对运动。其质心运动的拉格朗日量为
L c = 1 2 m c x ˙ c 2 (8.14) L_c=\frac 12m_c\dot{\boldsymbol x}_c^2\tag{8.14}
L c = 2 1 m c x ˙ c 2 ( 8.14 )
其等效于质量为 m t m_t m t 的自由粒子。相对运动的拉格朗日量为
L r = 1 2 m r r ˙ 2 − V ( r ) (8.15) L_r=\frac 12m_r\dot{\boldsymbol r}^2-V(r)\tag{8.15}
L r = 2 1 m r r ˙ 2 − V ( r ) ( 8.15 )
等效于位于中心势场 V ( r ) V(r) V ( r ) 中质量为 m r m_r m r 的粒子。
8.2 中心势场
8.2.1 中心势场中的运动
两体系统的质心作匀速直线运动,因此我们重点关注两体系统的相对运动,即单粒子在中心势场中的运动。记 m ≡ m r m\equiv m_r m ≡ m r ,拉格朗日量式(8.15)的运动方程为
m r ¨ = − ∇ V (8.16) m\ddot{\boldsymbol r}=-\nabla V\tag{8.16}
m r ¨ = − ∇ V ( 8.16 )
由 ∇ r = r r ≡ r ^ \nabla r=\frac{\boldsymbol r}{r}\equiv\hat r ∇ r = r r ≡ r ^ ,式(8.16)又可以写成
m r ¨ = − V ′ ( r ) r r (8.17) m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\tag{8.17}
m r ¨ = − V ′ ( r ) r r ( 8.17 )
欧式空间中梯度算符定义为 ∇ = e i ∂ ∂ x i \nabla=\boldsymbol e^i\frac{\partial }{\partial x^i} ∇ = e i ∂ x i ∂ ,所以
∇ r = e i ∂ r ∂ x i = r r \nabla r=\boldsymbol e^i \frac{\partial r}{\partial x^i}=\frac{\boldsymbol r}{r}
∇ r = e i ∂ x i ∂ r = r r
∇ V = e i ∂ V ∂ x i = ∂ V ∂ r e i ∂ r ∂ x i = V ′ r r \nabla V=\boldsymbol e^i \frac{\partial V}{\partial x^i}=\frac{\partial V}{\partial r} \boldsymbol e^i\frac{\partial r}{\partial x^i}=V'\frac{\boldsymbol r}{r}
∇ V = e i ∂ x i ∂ V = ∂ r ∂ V e i ∂ x i ∂ r = V ′ r r
中心势场具有球对称性,因此更方便的是选取球坐标 { r , θ , ϕ } \{r,\theta,\phi\} { r , θ , ϕ } ,于是式(8.15)成为
L = 1 2 m ( r ˙ 2 + r 2 θ ˙ 2 + r 2 sin 2 θ ϕ ˙ 2 ) − V ( r ) (8.18) L=\frac 12 m\left(\dot r^2+r^2\dot\theta^2+r^2\sin^2\theta\dot \phi^2 \right)-V(r) \tag{8.18}
L = 2 1 m ( r ˙ 2 + r 2 θ ˙ 2 + r 2 sin 2 θ ϕ ˙ 2 ) − V ( r ) ( 8.18 )
式(8.18)即是中心势场中粒子的拉格朗日量。
拉格朗日量式(8.18)不含 ϕ \phi ϕ ,即 ϕ \phi ϕ 是循环坐标,于是其共轭动量是运动常数
p ϕ ≡ ∂ L ∂ ϕ ˙ = m r 2 sin 2 θ ϕ ˙ = c o n s t = J z (8.19) p_\phi\equiv\frac{\partial L}{\partial \dot \phi}=mr^2\sin^2\theta\dot \phi=const=\boldsymbol J_z\tag{8.19}
p ϕ ≡ ∂ ϕ ˙ ∂ L = m r 2 sin 2 θ ϕ ˙ = co n s t = J z ( 8.19 )
由于空间各向同性,所以 z z z 轴可以任取,说明中心势场中粒子的角动量矢量守恒
J = c o n s t (8.20) \boldsymbol J=const \tag{8.20}
J = co n s t ( 8.20 )
中心势场中粒子的角动量守恒意味着中心势场中的粒子必做平面运动。因为角动量矢量的定义为
J = r × p (8.21) \boldsymbol J=\boldsymbol r\times\boldsymbol p\tag{8.21}
J = r × p ( 8.21 )
意味着相对中心的位矢 r \boldsymbol r r 和动量 p \boldsymbol p p 都和角动量垂直,换句话说,粒子的运动完全处于和角动量矢量 J \boldsymbol J J 垂直的平面内。
既然如此,可取平面极坐标 { r , ϕ } \{r,\phi \} { r , ϕ } 进一步简化计算。这时式(8.18)变成
L = 1 2 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) − V ( r ) (8.22) L=\frac 12m(\dot r^2+r^2\dot \phi^2)-V(r) \tag{8.22}
L = 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) − V ( r ) ( 8.22 )
这时 ϕ \phi ϕ 是循环坐标。共轭动量是运动常数
p ϕ ≡ m r 2 ϕ ˙ 2 = c o n s t ≡ J (8.23) p_\phi\equiv mr^2\dot \phi^2=const\equiv J \tag{8.23}
p ϕ ≡ m r 2 ϕ ˙ 2 = co n s t ≡ J ( 8.23 )
拉格朗日量式(8.22)不显含时间,能量函数为运动常数
h ≡ 1 2 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) + V ( r ) = c o n s t = E (8.24) h\equiv \frac 12m(\dot r^2+r^2\dot \phi^2)+V(r)=const=E\tag{8.24}
h ≡ 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) + V ( r ) = co n s t = E ( 8.24 )
对于中心势场的粒子,因为动能是广义速度的二次型,所以 E E E 即粒子的总能量。
以上我们得到中心势场中的粒子的两个运动常数,角动量大小为 J J J 和总能量 E E E ,由式(8.23)和(8.24)消去 ϕ ˙ \dot \phi ϕ ˙ ,得到
E = 1 2 m r ˙ 2 + J 2 2 m r 2 + V ( r ) (8.25) E=\frac 12m\dot r^2+\frac {J^2}{2mr^2}+V(r) \tag{8.25}
E = 2 1 m r ˙ 2 + 2 m r 2 J 2 + V ( r ) ( 8.25 )
这是关于径向坐标 r = r ( t ) r=r(t) r = r ( t ) 的单变量方程,且是一个一阶方程。由式(8.25)解出 r ˙ \dot r r ˙
d r d t = ± 2 m ( E − V ( r ) ) − J 2 2 m r 2 (8.26) \frac{\mathrm dr}{\mathrm dt}=\pm\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}\tag{8.26}
d t d r = ± m 2 ( E − V ( r )) − 2 m r 2 J 2 ( 8.26 )
积分得到
t = ± ∫ d r 2 m ( E − V ( r ) ) − J 2 2 m r 2 (8.27) t=\pm\int\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}}\tag{8.27}
t = ± ∫ m 2 ( E − V ( r )) − 2 m r 2 J 2 d r ( 8.27 )
给定势能 V ( r ) V(r) V ( r ) ,原则上由式(8.27)可以积出得到 t = t ( r ) t=t(r) t = t ( r ) ,亦即径向坐标随时间的演化 r = r ( t ) r=r(t) r = r ( t ) 。再代入式(8.23),即得到
ϕ = ϕ ( t ) = ∫ d t J m r 2 ( t ) (8.28) \phi=\phi(t)=\int\mathrm dt\frac{J}{mr^2(t)} \tag{8.28}
ϕ = ϕ ( t ) = ∫ d t m r 2 ( t ) J ( 8.28 )
即角坐标随时间的变化关系。由式(8.23)和(8.26)消去 d t \mathrm dt d t ,得到
m r 2 J d ϕ = ± d r 2 m ( E − V ( r ) ) − J 2 2 m r 2 (8.29) \frac{mr^2}{J}\mathrm d\phi=\pm\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}} \tag{8.29}
J m r 2 d ϕ = ± m 2 ( E − V ( r )) − 2 m r 2 J 2 d r ( 8.29 )
对上式积分,即可得到轨迹方程 r = r ( ϕ ) r=r(\phi) r = r ( ϕ ) 。遗憾的是,只有少数几种数学形式的 V ( r ) V(r) V ( r ) ,才能使式(8.29)得到解析结果。
8.2.2 定性讨论
由式(8.23)解得
ϕ ˙ = J 2 m r 2 (8.30) \dot \phi=\frac{J}{2mr^2}\tag{8.30}
ϕ ˙ = 2 m r 2 J ( 8.30 )
由之可得到如下定性结论:因为角动量守恒,且 J > 0 J>0 J > 0 ,因此 ϕ \phi ϕ 总是随时间单调变化,即粒子总是朝一个方向运动而不会回转。另一方面,式(8.30)意味着 ϕ ˙ ∝ 1 r 2 \dot \phi \propto \frac{1}{r^2} ϕ ˙ ∝ r 2 1 ,即距离中心越近转得越快,距离中心越远,转的越慢。这正是角动量守恒,亦即势能与动能相互转化的结果。
由式(8.25)知,径向运动可以看成单粒子在有效势能
V e f f ( r ) = V ( r ) + J 2 2 m r 2 (8.31) V_{\mathrm{eff}}(r)=V(r)+\frac{J^2}{2mr^2}\tag{8.31}
V eff ( r ) = V ( r ) + 2 m r 2 J 2 ( 8.31 )
中的一维运动,其中 J 2 2 m r 2 \frac{J^2}{2mr^2} 2 m r 2 J 2 可视为有效的离心势能。
由式(8.25)得到
1 2 m r ˙ 2 = E − V e f f ( r ) = E − J 2 2 m r 2 − V ( r ) ≥ 0 (8.32) \frac 12m\dot r^2=E-V_{\mathrm{eff}}(r)=E-\frac{J^2}{2mr^2}-V(r)\ge 0\tag{8.32}
2 1 m r ˙ 2 = E − V eff ( r ) = E − 2 m r 2 J 2 − V ( r ) ≥ 0 ( 8.32 )
因此总能量不小于有效势能,即 E ≥ V e f f ( r ) E\ge V_{\mathrm{eff}}(r) E ≥ V eff ( r ) 。在总能量给定的情况下,径向坐标 r r r 的运动范围由 r ˙ = 0 \dot r=0 r ˙ = 0 ,即方程
E − J 2 2 m r 2 − V ( r ) = 0 (8.33) E-\frac{J^2}{2mr^2}-V(r)= 0\tag{8.33}
E − 2 m r 2 J 2 − V ( r ) = 0 ( 8.33 )
决定。此方程的零点即轨道的转变点。
8.2.3 贝特朗定理
对于有界运动,由式(8.29)知,在从 r 1 r_1 r 1 到 r 2 r_2 r 2 ,再回到 r 1 r_1 r 1 的这一往复过程中,角度变化为
Δ ϕ = 2 ∫ t 1 t 2 J r 2 d r 2 m ( E − V ( r ) ) − J 2 r 2 (8.34) \Delta \phi=2\int_{t_1}^{t_2}\frac{J}{r^2}\frac{\mathrm dr}{\sqrt{2m(E-V(r))-\frac{J^2}{r^2}}} \tag{8.34}
Δ ϕ = 2 ∫ t 1 t 2 r 2 J 2 m ( E − V ( r )) − r 2 J 2 d r ( 8.34 )
若经过 n n n 个周期的往复,轨道闭合,即满足
n Δ ϕ = m 2 π , m , n = 1 , 2 , 3 , ⋯ (8.35) n\Delta \phi=m2\pi,\quad m,n=1,2,3,\cdots \tag{8.35}
n Δ ϕ = m 2 π , m , n = 1 , 2 , 3 , ⋯ ( 8.35 )
对于一般的中心势场,有界运动的轨道都不闭合,此时经过无限长的时间,轨道铺满 r 1 r_1 r 1 和 r 2 r_2 r 2 之间的圆环,如图所示
数学上可以证明,只有
V ∝ − 1 r 2 , V ∝ r 2 (8.36) V\propto -\frac{1}{r^2},\quad V\propto r^2 \tag{8.36}
V ∝ − r 2 1 , V ∝ r 2 ( 8.36 )
两种形式的中心势场,有限远动的轨道才是闭合的。这个结论即所谓贝特朗定理 (Bertrand‘s theorem)。
8.3 开普勒问题
到中心的距离成反比的中心势场
V ( r ) = − α r (8.37) V(r)=-\frac \alpha r\tag{8.37}
V ( r ) = − r α ( 8.37 )
是最常见也是最重要的一种势场,其中 α > 0 \alpha>0 α > 0 对应吸引势,α < 0 \alpha<0 α < 0 对应排斥势,对这一系统的求解称为开普勒问题 (Kepler problem)。以下我们假定 α > 0 \alpha >0 α > 0 。由式(8.31)知径向运动的有效势能为
V e f f = − α r + J 2 2 m r 2 (8.38) V_{\mathrm{eff}}=-\frac \alpha r+\frac{J^2}{2mr^2}\tag{8.38}
V eff = − r α + 2 m r 2 J 2 ( 8.38 )
有效势能在 V e f f ′ = 0 V'_{\mathrm{eff}}=0 V eff ′ = 0 处存在极值,对应
r m = J 2 m α (3.39) r_m=\frac{J^2}{m\alpha} \tag{3.39}
r m = m α J 2 ( 3.39 )
且由于 V e f f ′ ′ ( r m ) = α 4 m 3 J 6 > 0 V''_{\mathrm{eff}}(r_m)=\frac{\alpha^4m^3}{J^6}>0 V eff ′′ ( r m ) = J 6 α 4 m 3 > 0 ,所以是极小值,对应 ( V e f f ) min = V e f f ( r m ) = − α 2 m 2 J 2 (V_{\mathrm{eff}})_{\min}=V_{\mathrm{eff}}(r_m)=-\frac{\alpha^2m}{2J^2} ( V eff ) m i n = V eff ( r m ) = − 2 J 2 α 2 m 。此外,有效势能曲线存在零点 V e f f ( r ) = 0 V_{\mathrm{eff}}(r)=0 V eff ( r ) = 0 ,对应 r 0 = J 2 2 m α r_0=\frac{J^2}{2m\alpha} r 0 = 2 m α J 2 。
8.3.1 开普勒问题的求解
如图所示,根据系统能量的大小,可以将粒子的运动定性分为两类。当 ( V e f f ) min ≤ E < 0 (V_{\mathrm{eff}})_{\min}\le E<0 ( V eff ) m i n ≤ E < 0 时,式(8.33)有两个零点。粒子限制于 r 1 ≤ r ≤ r 2 r_1\le r\le r_2 r 1 ≤ r ≤ r 2 的环状区域做有界运动,这种状态即束缚态。 r 1 r_1 r 1 被称作近日点(preihelion), r 2 r_2 r 2 被称为远日点(aphelion)。当 r 1 = r 2 = r m r_1=r_2=r_m r 1 = r 2 = r m 时,即 E = ( V e f f ) min E=(V_{\mathrm{eff}})_{\min} E = ( V eff ) m i n ,轨道为半径 r m r_m r m 的正圆。当 E ≥ 0 E\ge0 E ≥ 0 时,式(8.33)有一个零点。此时存在近日点 r 1 r_1 r 1 ,但是不存在远日点。粒子可以运动至无穷远,因此做半无界运动。
由式(8.29)可知,轨道方程即
ϕ ( r ) = ∫ J m r 2 d r 2 m ( E + α r ) − J 2 m 2 r 2 (8.40) \phi(r)=\int \frac{J}{mr^2}\frac{\mathrm dr}{\sqrt{\frac 2m\left(E+\frac \alpha r \right)-\frac{J^2}{m^2r^2}}} \tag{8.40}
ϕ ( r ) = ∫ m r 2 J m 2 ( E + r α ) − m 2 r 2 J 2 d r ( 8.40 )
引入
p : = J 2 m α , e : = 1 + 2 E J 2 m α 2 (8.41) p:=\frac{J^2}{m\alpha},\quad e:=\sqrt{1+\frac{2EJ^2}{m\alpha^2}} \tag{8.41}
p := m α J 2 , e := 1 + m α 2 2 E J 2 ( 8.41 )
其中 p p p 被称作半通径 (semi latus rectum),e e e 被称作偏心率 (eccentricity)。积分式(8.40)可以解析积出
ϕ = ∫ d r p r 2 1 e 2 − ( 1 − p r ) 2 = u = 1 − p r ∫ d u e 2 − u 2 = arcsin ( u e ) + ϕ 0 (8.42) \phi=\int\mathrm dr\frac p{r^2}\frac{1}{\sqrt{e^2-\left(1-\frac pr\right)^2}}\xlongequal{u=1-\frac pr}\int\frac{\mathrm du}{\sqrt{e^2-u^2}}=\arcsin\left(\frac ue \right)+\phi_0 \tag{8.42}
ϕ = ∫ d r r 2 p e 2 − ( 1 − r p ) 2 1 u = 1 − r p ∫ e 2 − u 2 d u = arcsin ( e u ) + ϕ 0 ( 8.42 )
这里 ϕ 0 \phi_0 ϕ 0 是积分常数,方便起见取 ϕ 0 = π 2 \phi_0=\frac \pi2 ϕ 0 = 2 π 。于是轨道方程可以写成 u = − e cos ϕ u=-e\cos\phi u = − e cos ϕ ,即
r ( ϕ ) = p 1 + e cos ϕ (8.43) r(\phi)=\frac{p}{1+e\cos\phi}\tag{8.43}
r ( ϕ ) = 1 + e cos ϕ p ( 8.43 )
式(8.43)描述圆锥曲线。根据总能量的大小,分为三种情形:椭圆,抛物线和双曲线。
对应椭圆轨道,可以得到 r 1 = p 1 + e r_1=\frac{p}{1+e} r 1 = 1 + e p , r 2 = p 1 − e r_2=\frac{p}{1-e} r 2 = 1 − e p ,因此椭圆轨道的长轴为
2 a = r 1 + r 2 = 2 p 1 − e 2 = α ∣ E ∣ (8.44) 2a=r_1+r_2=\frac{2p}{1-e^2}=\frac{\alpha}{|E|} \tag{8.44}
2 a = r 1 + r 2 = 1 − e 2 2 p = ∣ E ∣ α ( 8.44 )
即椭圆轨道长轴只和粒子的能量 E E E 有关,与椭圆形状无关。椭圆轨道的半短轴为
b = a 1 − e 2 = J 2 m ∣ E ∣ (8.45) b=a\sqrt{1-e^2}=\frac{J}{\sqrt{2m|E|}} \tag{8.45}
b = a 1 − e 2 = 2 m ∣ E ∣ J ( 8.45 )
与能量和角动量都有关。粒子沿椭圆轨道运动一周所需的时间即周期,有角动量守恒式(8.23)得 J d t = m r 2 d ϕ J\mathrm dt=mr^2\mathrm d\phi J d t = m r 2 d ϕ ,代入轨道方程(8.43)积分得到(也可直接利用椭圆面积公式)
T = ∫ 0 2 π m r 2 ( ϕ ) J d ϕ = m J 2 π a b = π α m 2 ∣ E ∣ 3 = 2 π m α a 3 (8.46) T=\int_{0}^{2\pi}\frac{mr^2(\phi)}{J}\mathrm d\phi=\frac {m}{J}2\pi ab=\pi \alpha\sqrt{\frac{m}{2|E|^3}}=2\pi\sqrt{\frac m\alpha a^3} \tag{8.46}
T = ∫ 0 2 π J m r 2 ( ϕ ) d ϕ = J m 2 πab = π α 2∣ E ∣ 3 m = 2 π α m a 3 ( 8.46 )
这就是开普勒第三定理 (third law of Kepler),即椭圆轨道周期的平方能量绝对值的三次方成反比,或者与半长轴的三次方成正比。
8.3.2 拉普拉斯-龙格-楞次矢量
中心势场的空间转动不变性和时间平移不变性分别导致了角动量 J \boldsymbol J J 和总能量 E E E 的守恒。开普勒问题中轨道的闭合性意味着系统具有比时空对称性更高的对称性。这种对称性导致新的运动常数,即所谓拉普拉斯-龙格-楞次矢量 (Laplace-Runge-Lenz vector),简称 LRL 矢量,定义为
A = p × J − α m r r (8.47) \boldsymbol A=\boldsymbol p\times\boldsymbol J-\alpha m\frac{\boldsymbol r}{r} \tag{8.47}
A = p × J − α m r r ( 8.47 )
利用 p ≡ m r ˙ \boldsymbol p\equiv m\dot{\boldsymbol r} p ≡ m r ˙ 和 J ≡ r × p \boldsymbol J\equiv \boldsymbol r\times\boldsymbol p J ≡ r × p ,LRL 矢量可以展开写成
A = m 2 r ˙ 2 r − m 2 ( r ˙ ⋅ r ) r ˙ − α m r r (8.47) \boldsymbol A=m^2\dot{\boldsymbol r}^2\boldsymbol r-m^2(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot{\boldsymbol r}-\alpha m\frac{\boldsymbol r}{r}\tag{8.47}
A = m 2 r ˙ 2 r − m 2 ( r ˙ ⋅ r ) r ˙ − α m r r ( 8.47 )
由开普勒问题的运动方程(8.17)得 d p d t = m r ¨ = − V ′ ( r ) r r ≡ − α r 3 r \frac{\mathrm d\boldsymbol p}{\mathrm dt}=m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\equiv-\frac{\alpha}{r^3}\boldsymbol r d t d p = m r ¨ = − V ′ ( r ) r r ≡ − r 3 α r ,于是
d A d t = d p d t × J + α m 1 r 2 r ˙ r − α m r ˙ r = − α r 3 r × J + α m 1 r 2 r ˙ r − α m r ˙ r = − α r 3 r × ( r × p ) + α m 1 r 2 r ˙ r − α m r ˙ r = − α r 3 [ r ( r ⋅ p ) − r 2 p ] + α m 1 r 2 r ˙ r − α m r ˙ r = 0 (8.49) \begin{aligned}
\frac{\mathrm d\boldsymbol A}{\mathrm dt}&=\frac{\mathrm d\boldsymbol p}{\mathrm dt}\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\
&=-\frac{\alpha }{r^3}\boldsymbol r\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\
&=-\frac{\alpha }{r^3}\boldsymbol r\times(\boldsymbol r\times\boldsymbol p)+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\
&=-\frac{\alpha }{r^3}[\boldsymbol r(\boldsymbol r\cdot \boldsymbol p)-r^2\boldsymbol p]+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}=0
\end{aligned}
\tag{8.49}
d t d A = d t d p × J + α m r 2 1 r ˙ r − α m r r ˙ = − r 3 α r × J + α m r 2 1 r ˙ r − α m r r ˙ = − r 3 α r × ( r × p ) + α m r 2 1 r ˙ r − α m r r ˙ = − r 3 α [ r ( r ⋅ p ) − r 2 p ] + α m r 2 1 r ˙ r − α m r r ˙ = 0 ( 8.49 )
其中用到了 r ⋅ p = m r ⋅ r ˙ = 1 2 m d ( r ⋅ r ) d t \boldsymbol r\cdot \boldsymbol p=m\boldsymbol r\cdot\dot{\boldsymbol r}=\frac 12m\frac{\mathrm d(\boldsymbol r\cdot\boldsymbol r)}{\mathrm dt} r ⋅ p = m r ⋅ r ˙ = 2 1 m d t d ( r ⋅ r ) ,因此 LRL 矢量确实是运动常数。
可以验证
A ⋅ J = 0 (8.50) \boldsymbol A\cdot \boldsymbol J=0 \tag{8.50}
A ⋅ J = 0 ( 8.50 )
意味着 LRL 矢量 A \boldsymbol A A 和角动量矢量 J \boldsymbol J J 垂直,因此 LRL 矢量即位于轨道平面上。
利用 LRL 矢量,可以以非常简洁的方式得到轨道方程。既然 LRL 矢量 A \boldsymbol A A 处于轨道平面上且是常矢量,不妨取其作为轨道平面极坐标的极轴方向,即有 A ⋅ r = A r cos ϕ \boldsymbol A\cdot \boldsymbol r=Ar\cos\phi A ⋅ r = A r cos ϕ 。另一方面
A ⋅ r = ( p × J ) ⋅ r − α m r r ⋅ r = ( r × p ) ⋅ J − α m r = J 2 − α m r \boldsymbol A\cdot\boldsymbol r=(\boldsymbol p\times\boldsymbol J)\cdot\boldsymbol r-\alpha\frac{m}{r}\boldsymbol r\cdot\boldsymbol r=(\boldsymbol r\times\boldsymbol p)\cdot \boldsymbol J-\alpha mr=J^2-\alpha mr
A ⋅ r = ( p × J ) ⋅ r − α r m r ⋅ r = ( r × p ) ⋅ J − α m r = J 2 − α m r
于是可以解出轨道方程
r ( ϕ ) = J 2 α m + A cos ϕ (8.51) r(\phi)=\frac{J^2}{\alpha m+A\cos\phi} \tag{8.51}
r ( ϕ ) = α m + A cos ϕ J 2 ( 8.51 )
其正具有式(8.43)的形式。对比式(8.51)和(8.43),得到
p = J 2 m α , e = A m α (8.52) p=\frac{J^2}{m\alpha},\quad e=\frac{A}{m\alpha}\tag{8.52}
p = m α J 2 , e = m α A ( 8.52 )
同时 A = m α e A=m\alpha e A = m α e 意味着
A 2 = m 2 α 2 + 2 m E J 2 (8.53) A^2=m^2\alpha^2+2mEJ^2\tag{8.53}
A 2 = m 2 α 2 + 2 m E J 2 ( 8.53 )
式(8.53)表明,LRL 矢量的大小并不是独立的,而是由总能量 E E E 和角动量大小 J J J 决定。
由 LRL 矢量的定义式(8.47),有 α m J × r r = J × ( p × J − A ) = p J 2 − J × A \alpha m\boldsymbol J\times\frac{\boldsymbol r}{r}=\boldsymbol J\times(\boldsymbol p\times\boldsymbol J-\boldsymbol A)=\boldsymbol pJ^2-\boldsymbol J\times\boldsymbol A α m J × r r = J × ( p × J − A ) = p J 2 − J × A ,两边同求内积,得到
( p − J × A J 2 ) 2 = ( α m J ) 2 (8.54) \left(\boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} \right)^2=\left(\frac{\alpha m}{J}\right)^2\tag{8.54}
( p − J 2 J × A ) 2 = ( J α m ) 2 ( 8.54 )
因为角动量守恒,式(8.54)表明 p − J × A J 2 \boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} p − J 2 J × A 是一个长度固定为 α m J \frac{\alpha m}{J} J α m 的矢量,将其轨道平面取为 { x , y } \{x,y\} { x , y } -平面,即有 J = J e z \boldsymbol J=J\boldsymbol e_z J = J e z , p = p x e x + p y e y \boldsymbol p=p_x\boldsymbol e_x+p_y\boldsymbol e_y p = p x e x + p y e y 。令 LRL 矢量指向 x x x 方向,即 A = A e x \boldsymbol A=A\boldsymbol e_x A = A e x 。式(8.54)称为
p x 2 + ( p y − A J ) 2 = ( α m J ) 2 (8.55) p_x^2+\left(p_y-\frac{A}{J}\right)^2=\left(\frac{\alpha m}{J} \right)
^2\tag{8.55}
p x 2 + ( p y − J A ) 2 = ( J α m ) 2 ( 8.55 )
式(8.55)意味着在 { p x , p y } \{p_x,p_y\} { p x , p y } -平面上,粒子的动量轨迹是圆心为 { p x , p y } = { 0 , A J } \{p_x,p_y\}=\left\{0,\frac{A}{J} \right\} { p x , p y } = { 0 , J A } ,半径为 α m J \frac{\alpha m}{J} J α m 的圆周,这正是开普勒问题具有比纯空间的转动不变性更高的对称性的反映。
8.3.3 开普勒问题的对称性
开普勒问题中存在不同的轨道对应同一能量是一种不同于时空对称性的对称性的体现,这种对称性来源于势能 − α r -\frac{\alpha}{r} − r α 的特殊形式。
LRL 矢量所对应的直角坐标 x i x^i x i 的无穷小变换为
δ ( j ) x i = ϵ [ 2 x ˙ i x j − x i x ˙ j − ( r ⋅ r ˙ ) δ i j ] , i , j = 1 , 2 , 3 (8.56) \delta_{(j)}x_i=\epsilon[2\dot x_i x_j-x_i\dot x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})\delta_{ij}],\quad i,j=1,2,3\tag{8.56}
δ ( j ) x i = ϵ [ 2 x ˙ i x j − x i x ˙ j − ( r ⋅ r ˙ ) δ ij ] , i , j = 1 , 2 , 3 ( 8.56 )
这里 ϵ \epsilon ϵ 为无穷小参数, j j j 为给定某分量指标(在此方向的变换)。由式(8.56)得
δ ( j ) x ˙ i = d d t ( δ ( j ) x i ) = ϵ [ 2 x ¨ i x j + x ˙ i x ˙ j − x i x ¨ j − r ˙ 2 δ i j − ( r ⋅ r ¨ ) δ i j ] (8.57) \delta_{(j)}\dot x_i=\frac{\mathrm d}{\mathrm dt}\left(\delta_{(j)} x_i\right)=\epsilon[2\ddot x_ix_j+\dot x_i\dot x_j-x_i\ddot x_j-\dot {\boldsymbol r}^2\delta_{ij}-(\boldsymbol r\cdot \ddot{\boldsymbol r})\delta_{ij}] \tag{8.57}
δ ( j ) x ˙ i = d t d ( δ ( j ) x i ) = ϵ [ 2 x ¨ i x j + x ˙ i x ˙ j − x i x ¨ j − r ˙ 2 δ ij − ( r ⋅ r ¨ ) δ ij ] ( 8.57 )
开普勒问题作用量的变换为
Δ ( j ) S = ∫ d t ( m r ˙ ⋅ δ ( j ) r ˙ − α r 2 δ ( j ) r ) (8.58) \Delta_{(j)} S=\int \mathrm dt\left(m\dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}-\frac{\alpha}{r^2}\delta_{(j)} r \right)\tag{8.58}
Δ ( j ) S = ∫ d t ( m r ˙ ⋅ δ ( j ) r ˙ − r 2 α δ ( j ) r ) ( 8.58 )
计算可以得到
r ˙ ⋅ δ ( j ) r ˙ = x ˙ i δ ( j ) x ˙ i = ϵ d d t [ r ˙ 2 x j − ( r ˙ ⋅ r ) x ˙ j ] (8.59) \dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}=\dot x^i\delta_{(j)}\dot x_i=\epsilon\frac{\mathrm d}{\mathrm dt}\left[\dot{\boldsymbol r}^2x_j-(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot x_j \right] \tag{8.59}
r ˙ ⋅ δ ( j ) r ˙ = x ˙ i δ ( j ) x ˙ i = ϵ d t d [ r ˙ 2 x j − ( r ˙ ⋅ r ) x ˙ j ] ( 8.59 )
1 r 2 δ ( j ) r = 1 r 3 x i δ ( j ) x i = − ϵ d d t ( 1 r x j ) (8.60) \frac{1}{r^2}\delta_{(j)} r=\frac{1}{r^3}x^i\delta_{(j)}x_i=-\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac 1rx_j \right)\tag{8.60}
r 2 1 δ ( j ) r = r 3 1 x i δ ( j ) x i = − ϵ d t d ( r 1 x j ) ( 8.60 )
其中用到 r ⋅ r ˙ = d d t ( r ⋅ r ) − r ˙ ⋅ r = 1 2 d d t r 2 = r r ˙ \boldsymbol r\cdot \dot{\boldsymbol r}=\frac{\mathrm d}{\mathrm dt}(\boldsymbol r\cdot \boldsymbol r)-\dot{\boldsymbol r}\cdot \boldsymbol r=\frac 12\frac{\mathrm d}{\mathrm dt}r^2=r\dot r r ⋅ r ˙ = d t d ( r ⋅ r ) − r ˙ ⋅ r = 2 1 d t d r 2 = r r ˙
即都可以写成时间全导数的形式。代入式(8.58),即有
Δ ( j ) S = ∫ d t d F ( j ) d t , F ( j ) = ϵ [ m ( r ˙ 2 x j − ( r ⋅ r ˙ ) x j ) + α 1 r x j ] (8.61) \Delta_{(j)} S=\int \mathrm dt \frac{\mathrm dF_{(j)}}{\mathrm dt},\quad F_{(j)}=\epsilon\left[m(\dot{\boldsymbol r}^2x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})x_j)+\alpha \frac 1rx_j \right] \tag{8.61}
Δ ( j ) S = ∫ d t d t d F ( j ) , F ( j ) = ϵ [ m ( r ˙ 2 x j − ( r ⋅ r ˙ ) x j ) + α r 1 x j ] ( 8.61 )
根据诺特定理,存在运动常数
Q ( j ) = 1 ϵ ( ∂ L ∂ x ˙ i δ ( j ) x i − F ( j ) ) = m r ˙ 2 x j − m ( r ˙ ⋅ r ) x ˙ j − α r x j ≡ 1 m A j , j = 1 , 2 , 3 (8.62) Q_{(j)}=\frac 1\epsilon\left(\frac{\partial L}{\partial \dot x_i}\delta_{(j)}x_i-F_(j) \right)=m\dot{\boldsymbol r}^2x_j-m(\dot{\boldsymbol r} \cdot \boldsymbol r)\dot x_j-\frac{\alpha}{r}x_j\equiv \frac{1}{m}A_j,\quad j=1,2,3 \tag{8.62}
Q ( j ) = ϵ 1 ( ∂ x ˙ i ∂ L δ ( j ) x i − F ( j ) ) = m r ˙ 2 x j − m ( r ˙ ⋅ r ) x ˙ j − r α x j ≡ m 1 A j , j = 1 , 2 , 3 ( 8.62 )
正是 LRL 矢量。
Chapter 9 微扰展开
9.1 线性化与微扰论
对于非线性的系统,我们希望将其线性化 (linearization),即将物理系统在已知的解附近做近似,保留线性阶,得到一个线性系统。重复此步骤,可以一点点拓宽物理系统在解空间中的已知区域。这个过程就是微扰论 (perturbation theory)。
9.2 函数的微扰展开
微扰论的基本手续是微扰展开 (perturbative expansion)。
考虑一元函数 F ( x ) F(x) F ( x ) ,在某点 x ‾ \overline x x 处取极值为 F ( x ‾ ) F(\overline x) F ( x ) 。当变量 x x x 与 x ‾ \overline x x 有微小的偏离时,记
x = x ‾ + δ x (9.1) x=\overline x+\delta x\tag{9.1}
x = x + δ x ( 9.1 )
则由之产生的 F ( x ) F(x) F ( x ) 与 F ( x ‾ ) F(\overline x) F ( x ) 的偏离为
F ( x ‾ + δ x ) − F ( x ‾ ) = F ′ ( x ‾ ) δ x ⏟ = 0 + 1 2 F ′ ′ ( x ‾ ) ( δ x ) 2 + ⋯ (9.2) F(\overline x+\delta x)-F(\overline x)=\underbrace{F'(\overline x)\delta x}_{=0}+\frac 12F''(\overline x)(\delta x)^2+\cdots\tag{9.2}
F ( x + δ x ) − F ( x ) = = 0 F ′ ( x ) δ x + 2 1 F ′′ ( x ) ( δ x ) 2 + ⋯ ( 9.2 )
在微扰展开的语言中,相对其做展开的点 x ‾ \overline x x 被称作背景 (background),对背景的小“偏离” δ x \delta x δ x 被称为扰动 (perturbation)或微扰。在式(9.2)中, F ‾ ≡ F ( x ‾ ) \overline F\equiv F(\overline x) F ≡ F ( x ) 即函数的背景值 (background value),只和 x ‾ \overline x x 有关。式(9.2)等号右边第一项为扰动 δ x \delta x δ x 的线性项 (linear term) F 1 ( δ x ) ≡ F ′ ( x ‾ ) δ x F_1(\delta x)\equiv F'(\overline x)\delta x F 1 ( δ x ) ≡ F ′ ( x ) δ x 。第二项为展开的二次项 (quadratic term)F 2 ( δ x ) ≡ 1 2 F ′ ′ ( x ) δ x F_2(\delta x)\equiv\frac 12F''(x)\delta x F 2 ( δ x ) ≡ 2 1 F ′′ ( x ) δ x ,是扰动 δ x \delta x δ x 的二次型。可以看出,二次项 F 2 ( δ x ) F_2(\delta x) F 2 ( δ x ) 是在极值点 x ‾ \overline x x 附近、函数微扰展开的领头阶近似 (leading order approximation)或最低阶近似 (lowest orfer approximation)。
9.3 作用量的微扰展开
9.3.1 单自由度
先考虑单自由度的系统,拉格朗日量为 L ( t , q , q ˙ ) L(t,q,\dot q) L ( t , q , q ˙ ) 。给定一组运动方程,有无穷多个解,对应无穷多种初始(边界)条件。假定已知系统运动方程的某个特解 q ‾ = q ‾ ( t ) \overline q=\overline q(t) q = q ( t ) ,其满足运动方程即意味着其使得作用量取极值
− δ S δ q ∣ q ‾ = ( d d t ∂ L ∂ q ˙ − ∂ L ∂ q ) ∣ q ‾ = 0 (9.3) -\left . \frac{\delta S}{\delta q} \right |_{\overline q}=\left.\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q}-\frac{\partial L}{\partial q} \right) \right|_{\overline q}=0\tag{9.3}
− δ q δ S q = ( d t d ∂ q ˙ ∂ L − ∂ q ∂ L ) q = 0 ( 9.3 )
在微扰展开中,这个已知的特解 q ‾ ( t ) \overline q(t) q ( t ) 被称为背景位形 (background configuration),简称为背景。现在考虑系统对这个背景的“小偏离”,记作
q ( t ) = q ‾ ( t ) + ϵ δ q ( t ) (9.4) q(t)=\overline q(t)+\epsilon\delta q(t) \tag{9.4}
q ( t ) = q ( t ) + ϵδ q ( t ) ( 9.4 )
这里 δ q \delta q δ q 即表征系统位形对背景位形 q ‾ \overline q q 的偏离,被称作扰动 (perturbation),ϵ \epsilon ϵ 是用来表征扰动大小的小量。作用量 S [ q ] = S [ q ‾ + ϵ δ q ] S[q]=S[\overline q+\epsilon \delta q] S [ q ] = S [ q + ϵδ q ] 是 ϵ \epsilon ϵ 的普通函数,做泰勒展开,得到
S [ q ‾ + ϵ δ q ] = ∫ d t L ( t , q ‾ + ϵ δ q , q ˙ + ϵ δ q ˙ ) = ∫ d t ∑ n = 0 ∞ ϵ n n ! [ ( δ q ∂ ∂ q + δ q ˙ ∂ ∂ q ˙ ) n L ] ∣ q ‾ ≡ S 0 + ϵ S 1 + ϵ 2 S 2 + ϵ 3 S 3 + ⋯ (9.5) \begin{aligned}
S[\overline q+\epsilon\delta q]&=\int \mathrm dtL(t,\overline q+\epsilon\delta q,\dot q+\epsilon \delta \dot q)=\int \mathrm dt \sum_{n=0}^\infty\frac{\epsilon^n}{n!}\left .\left[\left( \delta q\frac{\partial}{\partial q}+\delta \dot q\frac{\partial}{\partial \dot q}\right)^nL \right]\right|_{\overline q}\\
&\equiv S_0+\epsilon S_1+\epsilon^2S_2+\epsilon^3S_3+\cdots
\end{aligned}\tag{9.5}
S [ q + ϵδ q ] = ∫ d t L ( t , q + ϵδ q , q ˙ + ϵδ q ˙ ) = ∫ d t n = 0 ∑ ∞ n ! ϵ n [ ( δ q ∂ q ∂ + δ q ˙ ∂ q ˙ ∂ ) n L ] q ≡ S 0 + ϵ S 1 + ϵ 2 S 2 + ϵ 3 S 3 + ⋯ ( 9.5 )
我们按照 ϵ \epsilon ϵ 的阶数,对 S n S_n S n 逐阶讨论。
在零阶,
S 0 [ δ q ] ≡ ∫ d t L ( t , q ‾ , q ‾ ˙ ) (9.6) S_0[\delta q]\equiv \int\mathrm dtL(t,\overline q,\dot {\overline q}) \tag{9.6}
S 0 [ δ q ] ≡ ∫ d t L ( t , q , q ˙ ) ( 9.6 )
就是背景本身的作用量。
在一阶,
S 1 [ δ q ] = ∫ d t ( ∂ L ∂ q ∣ q ‾ δ q + ∂ L ∂ q ˙ ∣ q ‾ δ q ˙ ) ≃ ∫ d t / ( ∂ L ∂ q − d d t ∂ L ∂ q ˙ ) ∣ q ‾ ⏟ = 0 δ q ≡ 0 (9.7) S_1[\delta q]=\int \mathrm dt\left(\left.\frac{\partial L}{\partial q}\right|_{\overline q}\delta q+\left.\frac{\partial L}{\partial \dot q}\right|_{\overline q}\delta \dot q \right)\simeq\int \mathrm dt\underbrace{\left/\left(\frac{\partial L}{\partial q}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q} \right)\right|_{\overline q}}_{=0}\delta q\equiv 0\tag{9.7}
S 1 [ δ q ] = ∫ d t ( ∂ q ∂ L q δ q + ∂ q ˙ ∂ L q δ q ˙ ) ≃ ∫ d t = 0 / ( ∂ q ∂ L − d t d ∂ q ˙ ∂ L ) q δ q ≡ 0 ( 9.7 )
即
δ S δ q ∣ q ‾ = 0 ⇒ S 1 [ δ q ] = 0 (9.8) \left.\frac{\delta S}{\delta q} \right|_{\overline q}=0\quad \Rightarrow\quad S_1[\delta q]=0\tag{9.8}
δ q δ S q = 0 ⇒ S 1 [ δ q ] = 0 ( 9.8 )
扰动的一阶项恒为零。
在二阶,扰动的二阶作用量 (quadratic action)为
S 2 [ δ q ] = ∫ d t ( 1 2 G ( δ q ˙ ) 2 + N δ q ˙ δ q + 1 2 M ( δ q ) 2 ) (9.9) S_2[\delta q]=\int\mathrm dt\left(\frac 12G(\delta \dot q)^2+N\delta \dot q\delta q+\frac 12M(\delta q)^2 \right)\tag{9.9}
S 2 [ δ q ] = ∫ d t ( 2 1 G ( δ q ˙ ) 2 + N δ q ˙ δ q + 2 1 M ( δ q ) 2 ) ( 9.9 )
上式中被积函数即扰动的二次拉格朗日量。其中
G = ∂ 2 L ∂ q ˙ 2 ∣ q ‾ , N = ∂ 2 ∂ q ˙ ∂ q ∣ q ‾ , M = ∂ 2 L ∂ q 2 ∣ q ‾ (9.10) G=\left. \frac{\partial^2 L}{\partial \dot q^2}\right|_{\overline q},\quad N=\left. \frac{\partial ^2}{\partial \dot q\partial q} \right|_{\overline q},\quad M=\left.\frac{\partial^2 L}{\partial q^2} \right|_{\overline q} \tag{9.10}
G = ∂ q ˙ 2 ∂ 2 L q , N = ∂ q ˙ ∂ q ∂ 2 q , M = ∂ q 2 ∂ 2 L q ( 9.10 )
都是“背景” q ‾ \overline q q 的函数。利用分部积分 N δ q ˙ δ q ≃ − 1 2 N ˙ ( δ q ) 2 N\delta \dot q\delta q\simeq -\frac 12\dot N(\delta q)^2 N δ q ˙ δ q ≃ − 2 1 N ˙ ( δ q ) 2 ,得到
S 2 [ δ q ] = ∫ d t 1 2 [ G ( δ q ˙ ) 2 − W ( δ q ) 2 ] (9.11) S_2[\delta q]=\int \mathrm dt\frac 12\left[G(\delta \dot q)^2-W(\delta q)^2 \right]\tag{9.11}
S 2 [ δ q ] = ∫ d t 2 1 [ G ( δ q ˙ ) 2 − W ( δ q ) 2 ] ( 9.11 )
其中
W = N ˙ − M (9.12) W=\dot N-M \tag{9.12}
W = N ˙ − M ( 9.12 )
Example 9.2 单摆的扰动
单摆的拉格朗日作用量为 L = 1 2 m l 2 θ ˙ 2 + m g l cos θ L=\frac12 ml^2\dot \theta ^2+mgl\cos\theta L = 2 1 m l 2 θ ˙ 2 + m g l cos θ 。假设已知 θ ‾ ( t ) \overline \theta(t) θ ( t ) ,作为背景解,满足运动方程,即 θ ¨ + g l sin θ ‾ = 0 \ddot \theta +\frac{g}{l}\sin\overline \theta=0 θ ¨ + l g sin θ = 0 。考虑另一个可能解,与背景有小偏离,记为 θ = θ ‾ + ϵ δ θ \theta=\overline \theta+\epsilon \delta \theta θ = θ + ϵδ θ ,这里 δ θ \delta \theta δ θ 即扰动。代入拉格朗日量,得到
L = 1 2 m l 2 ( θ ‾ ˙ + ϵ δ θ ˙ ) 2 + m g l cos ( θ ‾ + ϵ δ θ ) = L 0 + L 1 + L 2 + ⋯ L=\frac 12ml^2\left(\dot{\overline \theta}+\epsilon \delta \dot\theta \right)^2+mgl\cos(\overline \theta+\epsilon\delta \theta)=L_0+L_1+L_2+\cdots
L = 2 1 m l 2 ( θ ˙ + ϵδ θ ˙ ) 2 + m g l cos ( θ + ϵδ θ ) = L 0 + L 1 + L 2 + ⋯
其中 L 0 = 1 2 m l 2 θ ‾ ˙ 2 + m g l cos θ ‾ L_0=\frac 12ml^2\dot{\overline \theta}^2+mgl\cos\overline \theta L 0 = 2 1 m l 2 θ ˙ 2 + m g l cos θ 即背景拉格朗量,L 1 ≃ m l 2 ( θ ‾ ¨ − g l sin θ ‾ ) δ θ ≡ 0 L_1\simeq ml^2(\ddot{\overline \theta}-\frac{g}{l}\sin\overline \theta)\delta \theta\equiv 0 L 1 ≃ m l 2 ( θ ¨ − l g sin θ ) δ θ ≡ 0 为一阶拉格朗日量。L 2 L_2 L 2 为二次拉格朗日量,
L 2 = 1 2 ( m l 2 ( δ θ ˙ ) 2 − m g l cos θ ‾ ( δ θ ) 2 ) L_2=\frac 12\left(ml^2\left(\delta \dot \theta\right)^2-mgl\cos\overline \theta(\delta \theta)^2 \right)
L 2 = 2 1 ( m l 2 ( δ θ ˙ ) 2 − m g l cos θ ( δ θ ) 2 )
9.3.2 多自由度
记广义坐标为 { q a } \{q^a\} { q a } ,扰动记为
q a ( t ) = q ‾ a ( t ) + ϵ δ q a ( t ) , a = 1 , 2 , ⋯ , s (9.13) q^a(t)=\overline q^a(t)+\epsilon \delta q^a(t),\quad a=1,2,\cdots,s\tag{9.13}
q a ( t ) = q a ( t ) + ϵδ q a ( t ) , a = 1 , 2 , ⋯ , s ( 9.13 )
这里 { q ‾ ( t ) } \{\overline {\boldsymbol q}(t)\} { q ( t )} 是某组已知的特解,{ δ q } \{\delta \boldsymbol q\} { δ q } 代表扰动。与单自由度系统作用量的展开形式类似,拉格朗日量为 L ( t , q , q ˙ ) L(t,\boldsymbol q,\dot {\boldsymbol q}) L ( t , q , q ˙ ) ,作用量 S [ q ‾ + ϵ δ q ] S[\overline{\boldsymbol q}+\epsilon \delta \boldsymbol q] S [ q + ϵδ q ] 展开得到
∫ d t L ( t , q ‾ + ϵ δ q , q ‾ ˙ + ϵ δ q ˙ ) = ∫ d t ∑ n = 0 ∞ ϵ n n ! [ ( δ q a ∂ ∂ q a + δ q ˙ a ∂ ∂ q ˙ a ) n L ] ∣ q ‾ ≡ S 0 [ q ‾ ] + ϵ S 1 [ q ‾ ] ⏟ = 0 + ϵ 2 S 2 [ q ‾ ] + ϵ 3 S 3 [ q ‾ ] + ⋯ (9.14) \begin{aligned}
&\int\mathrm dtL\left(t,\overline{\boldsymbol q}+\epsilon \delta\boldsymbol q,\dot{\overline{\boldsymbol q}}+\epsilon\delta \dot{\boldsymbol q} \right)=\int \mathrm dt\sum_{n=0}^{\infty}\frac{\epsilon ^n}{n!}\left.\left[\left(\delta q^a\frac{\partial }{\partial q^a}+\delta \dot q^a\frac{\partial }{\partial \dot q^a} \right)^n L\right]\right|_{\overline{\boldsymbol q}} \\
\equiv& S_0[\overline{\boldsymbol q}]+\epsilon\underbrace{ S_1[\overline{\boldsymbol q}]}_{=0}+\epsilon^2S_2[\overline{\boldsymbol q}]+\epsilon^3S_3[\overline{\boldsymbol q}]+\cdots
\end{aligned}\tag{9.14}
≡ ∫ d t L ( t , q + ϵδ q , q ˙ + ϵδ q ˙ ) = ∫ d t n = 0 ∑ ∞ n ! ϵ n [ ( δ q a ∂ q a ∂ + δ q ˙ a ∂ q ˙ a ∂ ) n L ] q S 0 [ q ] + ϵ = 0 S 1 [ q ] + ϵ 2 S 2 [ q ] + ϵ 3 S 3 [ q ] + ⋯ ( 9.14 )
S 0 [ q ‾ ] = ∫ d t L ( t , q ‾ , q ‾ ˙ ) S_0[\overline q]=\int \mathrm dtL(t,\overline{\boldsymbol q},\dot{\overline{\boldsymbol q}}) S 0 [ q ] = ∫ d t L ( t , q , q ˙ ) 是背景作用量,扰动的一阶作用量恒为零 S 1 [ δ q ] = 0 S_1[\delta \boldsymbol q]=0 S 1 [ δ q ] = 0 。
在二阶,直接展开得到扰动的二次作用量为
S 2 [ δ q ] = ∫ d t ( 1 2 G a b δ q ˙ a δ q ˙ b + N a b δ q ˙ a δ q b + 1 2 M a b δ q a δ q b ) (9.15) S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac 12G_{ab}\delta \dot q^a\delta \dot q^b+N_{ab}\delta \dot q^a\delta q^b+\frac 12 M_{ab}\delta q^a\delta q^b \right) \tag{9.15}
S 2 [ δ q ] = ∫ d t ( 2 1 G ab δ q ˙ a δ q ˙ b + N ab δ q ˙ a δ q b + 2 1 M ab δ q a δ q b ) ( 9.15 )
这里
G a b : = ∂ 2 L ∂ q ˙ a ∂ q ˙ b ∣ q ‾ , N a b : = ∂ 2 L ∂ q ˙ a ∂ q b ∣ q ‾ , M a b = ∂ 2 L ∂ q a ∂ q b (9.16) G_{ab}:=\left.\frac{\partial^2 L}{\partial \dot q^a\partial \dot q^b}\right|_{\overline{\boldsymbol q}},\quad N_{ab}:=\left.\frac{\partial^2 L}{\partial \dot q^a\partial q^b}\right|_{\overline{\boldsymbol q}},\quad M_{ab}=\frac{\partial ^2 L}{\partial q^a\partial q^b} \tag{9.16}
G ab := ∂ q ˙ a ∂ q ˙ b ∂ 2 L q , N ab := ∂ q ˙ a ∂ q b ∂ 2 L q , M ab = ∂ q a ∂ q b ∂ 2 L ( 9.16 )
都是背景的函数。扰动的二次作用量可以通过分部积分约化为
S 2 [ δ q ] = ∫ d t ( 1 2 G a b δ q ˙ a δ q ˙ b + 1 2 F a b δ q ˙ a δ q b − 1 2 W a b δ q a δ q b ) (9.17) S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac12 G_{ab}\delta \dot q^a\delta \dot q^b +\frac12 F_{ab}\delta \dot q^a\delta q^b-\frac 12W_{ab}\delta q^a\delta q^b \right) \tag{9.17}
S 2 [ δ q ] = ∫ d t ( 2 1 G ab δ q ˙ a δ q ˙ b + 2 1 F ab δ q ˙ a δ q b − 2 1 W ab δ q a δ q b ) ( 9.17 )
其中
F a b = N a b − N b a , W a b = − M a b + N ˙ b a (9.18) F_{ab}=N_{ab}-N_{ba},\quad W_{ab}=-M_{ab}+\dot N_{ba} \tag{9.18}
F ab = N ab − N ba , W ab = − M ab + N ˙ ba ( 9.18 )
N a b δ q ˙ a δ q b = 1 2 N a b δ q ˙ a δ q b + 1 2 N b a δ q ˙ b δ q a = 1 2 ( N a b − N b a ) − 1 2 N ˙ b a δ q b δ q a + 1 2 d d t ( N b a δ q b δ q a ) \begin{aligned}
N_{ab}\delta \dot q^a\delta q^b&=\frac 12N_{ab}\delta \dot q^a\delta q^b+\frac 12N_{ba}\delta \dot q^b\delta q^a \\\
&=\frac 12(N_{ab}-N_{ba})-\frac{1}{2}\dot N_{ba}\delta q^b\delta q^a+\frac12\frac{\mathrm d}{\mathrm dt}\left(N_{ba}\delta q^b\delta q^a \right)
\end{aligned}
N ab δ q ˙ a δ q b = 2 1 N ab δ q ˙ a δ q b + 2 1 N ba δ q ˙ b δ q a = 2 1 ( N ab − N ba ) − 2 1 N ˙ ba δ q b δ q a + 2 1 d t d ( N ba δ q b δ q a )
注意式(9.17)中,G a b G_{ab} G ab 是对称的,而 F a b F_{ab} F ab 是反对称的。用矩阵形式,式(9.17)可以写成
S 2 [ δ q ] = ∫ d t ( 1 2 ( δ q ˙ ) T G δ q ˙ + 1 2 ( δ q ˙ ) T F a b δ q − 1 2 ( δ q ) T W a b δ q ) (9.19) S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac 12(\delta \dot{\boldsymbol q})^TG\delta \dot{\boldsymbol q}+\frac 12 (\delta \dot{\boldsymbol q})^T F_{ab}\delta \boldsymbol q -\frac 12(\delta \boldsymbol q)^TW_{ab}\delta \boldsymbol q \right) \tag{9.19}
S 2 [ δ q ] = ∫ d t ( 2 1 ( δ q ˙ ) T G δ q ˙ + 2 1 ( δ q ˙ ) T F ab δ q − 2 1 ( δ q ) T W ab δ q ) ( 9.19 )
Example 9.3 中心势场中的扰动
考虑中心势场中的粒子,约化成 2 维平面上的运动,拉格朗日量为 L = 1 2 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) − V ( r ) L=\frac 12 m\left(\dot r^2+r^2\dot \phi^2\right)-V(r) L = 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) − V ( r ) 。假设已知解 r ‾ ( t ) \overline r(t) r ( t ) 和 ϕ ‾ ( t ) \overline \phi(t) ϕ ( t ) ,作为背景。考虑另一组可能的解,记为 r = r ‾ + ρ r=\overline r+\rho r = r + ρ 和 ϕ = ϕ ‾ + φ \phi=\overline \phi+\varphi ϕ = ϕ + φ ,这里 ρ \rho ρ 和 φ \varphi φ 是扰动。代入拉格朗日量,展开得到
L = 1 2 m [ ( r ‾ ˙ + ρ ˙ ) 2 + ( r ‾ + ρ ) 2 ( ϕ ‾ ˙ + φ ˙ ) 2 ] − V ( r ‾ + ρ ) = L 0 + L 1 + L 2 + ⋯ L=\frac 12m\left[\left(\dot {\overline r}+\dot \rho\right)^2 +(\overline r+\rho)^2\left(\dot{\overline \phi}+\dot \varphi \right)^2 \right]-V(\overline r+\rho)=L_0+L_1+L_2+\cdots
L = 2 1 m [ ( r ˙ + ρ ˙ ) 2 + ( r + ρ ) 2 ( ϕ ˙ + φ ˙ ) 2 ] − V ( r + ρ ) = L 0 + L 1 + L 2 + ⋯
其中,L 0 = 1 2 m ( r ‾ ˙ 2 + r ‾ 2 ϕ ‾ ˙ 2 ) − V ( r ‾ ) L_0=\frac 12m\left(\dot{\overline r}^2+\overline r^2\dot{\overline \phi}^2\right)-V(\overline r) L 0 = 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) − V ( r ) 。 L 1 L_1 L 1 为扰动的一阶拉格朗日量,做分部积分后,系数正比于背景运动方程
L 1 = m ( r ‾ ˙ ρ ˙ + r ‾ 2 ϕ ‾ ˙ φ ˙ + r ‾ ϕ ‾ ˙ 2 ρ ) − V ′ ( r ‾ ) ρ ≃ ( − m r ‾ ¨ + m r ‾ ϕ ‾ ˙ 2 − V ′ ( r ‾ ) ) ρ − m d d t ( r ‾ 2 ϕ ‾ ˙ ) φ = 0 \begin{aligned}
L_1&=m(\dot{\overline r}\dot \rho+\overline r^2\dot{\overline \phi}\dot \varphi+\overline r\dot{\overline \phi}^2\rho)-V'(\overline r)\rho\\
&\simeq \left(-m\ddot{\overline r}+m\overline r\dot{\overline \phi}^2 -V'(\overline r)\right)\rho-m\frac{\mathrm d}{\mathrm dt}\left(\overline r^2\dot{\overline \phi} \right)\varphi=0
\end{aligned}
L 1 = m ( r ˙ ρ ˙ + r 2 ϕ ˙ φ ˙ + r ϕ ˙ 2 ρ ) − V ′ ( r ) ρ ≃ ( − m r ¨ + m r ϕ ˙ 2 − V ′ ( r ) ) ρ − m d t d ( r 2 ϕ ˙ ) φ = 0
L 2 L_2 L 2 为扰动 ρ \rho ρ 和 φ \varphi φ 的二次拉格朗日量
L 2 = 1 2 m ρ ˙ 2 + 1 2 ( m ϕ ‾ ˙ 2 − V ′ ′ ( r ‾ ) ) ρ 2 + 1 2 m r 2 φ ˙ 2 + 2 m r ‾ ϕ ‾ ˙ ρ φ ˙ L_2=\frac 12m\dot \rho^2+\frac 12\left(m\dot{\overline \phi}^2-V''(\overline r) \right)\rho^2+\frac 12mr^2\dot \varphi^2+2m\overline r\dot{\overline \phi}\rho\dot\varphi
L 2 = 2 1 m ρ ˙ 2 + 2 1 ( m ϕ ˙ 2 − V ′′ ( r ) ) ρ 2 + 2 1 m r 2 φ ˙ 2 + 2 m r ϕ ˙ ρ φ ˙
其中系数都是背景(已知)的函数。
总之,作用量的微扰展开得到扰动的作用量,具有形式
S [ q + δ q ] − S [ q ‾ ] = S 2 [ δ q ] ⏟ 自由部分(free part) + S 3 [ δ q ] + S 4 [ δ q ] + ⋯ ⏟ 相互作用(interations) (9.20) S[\boldsymbol q+\delta \boldsymbol q]-S[\overline{\boldsymbol q}]=\underbrace{S_2[\delta \boldsymbol q]}_{自由部分(\text{free part})}+\underbrace{S_3[\delta\boldsymbol q]+S_4[\delta \boldsymbol q]+\cdots }_{相互作用(\text{interations})} \tag{9.20}
S [ q + δ q ] − S [ q ] = 自由部分( free part ) S 2 [ δ q ] + 相互作用( interations ) S 3 [ δ q ] + S 4 [ δ q ] + ⋯ ( 9.20 )
9.4 稳定平衡位形附近的微扰展开
平衡位形 (equilibrium configuration)
q ‾ a = c o n s t , a = 1 , ⋯ , s (9.21) \overline q^a=const,\quad a=1,\cdots,s \tag{9.21}
q a = co n s t , a = 1 , ⋯ , s ( 9.21 )
即系统运动方程的静态 (static)解。
9.4.1 单自由度
平衡条件等价于
( d d t ∂ L ∂ q ˙ − ∂ L ∂ q ) ∣ q ‾ = ∂ 2 L ∂ q ˙ ∂ t ∣ q ‾ + ∂ 2 L ∂ q ˙ ∂ q ∣ q ‾ q ˙ + ∂ 2 L ∂ q ˙ 2 ∣ q ‾ q ¨ ⏟ = 0 − ∂ L ∂ q ∣ q ‾ = 0 ⇒ ∂ L ∂ q ∣ q ‾ = 0 (9.22) \left.\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q}-\frac{\partial L}{\partial q} \right)\right|_{\overline q}=\underbrace{\left.\frac{\partial ^2 L}{\partial \dot q\partial t} \right|_{\overline q}+\left.\frac{\partial^2 L}{\partial \dot q\partial q}\right|_{\overline q}\dot q+\left.\frac{\partial ^2L}{\partial \dot q^2}\right|_{\overline q}\ddot q}_{=0}-\left.\frac{\partial L}{\partial q} \right|_{\overline q}=0\quad\Rightarrow \quad \left.\frac{\partial L}{\partial q} \right|_{\overline q}=0 \tag{9.22}
( d t d ∂ q ˙ ∂ L − ∂ q ∂ L ) q = = 0 ∂ q ˙ ∂ t ∂ 2 L q + ∂ q ˙ ∂ q ∂ 2 L q q ˙ + ∂ q ˙ 2 ∂ 2 L q q ¨ − ∂ q ∂ L q = 0 ⇒ ∂ q ∂ L q = 0 ( 9.22 )
对于非相对论性定常系统,拉格朗日量为 L = T − V = 1 2 G ( q ) q ˙ 2 − V ( q ) L=T-V=\frac 12G(q)\dot q^2-V(q) L = T − V = 2 1 G ( q ) q ˙ 2 − V ( q ) 。因此,平衡条件即
∂ V ∂ q ∣ q ‾ = 0 (9.23) \left.\frac{\partial V}{\partial q} \right|_{\overline q}=0\tag{9.23}
∂ q ∂ V q = 0 ( 9.23 )
对应势能的极值点。
通常要求扰动的背景是稳定 (stable)的,即扰动不会随着时间无限增大。在领头阶,这就要求扰动的线性运动是小振动方程,这样扰动才会围绕背景作往复振动,而不会无限偏离。扰动的二次作用量由式(9.11)给出,对于平衡位形 G G G 和 W W W 都是常数。小振动方程要求 W / G > 0 W/G>0 W / G > 0 。对于非相对论性定常系统
G = ∂ 2 L ∂ q ˙ 2 ∣ q ‾ = ∂ 2 T ∂ q ˙ 2 ∣ q ‾ , W = − ∂ 2 L ∂ q 2 ∣ q ‾ = d 2 V d q 2 ∣ q ‾ (9.24) G=\left.\frac{\partial ^2L}{\partial \dot q^2} \right|_{\overline q}=\left.\frac{\partial ^2 T}{\partial \dot q^2} \right|_{\overline q},\quad W=-\left.\frac{\partial^2 L}{\partial q^2} \right|_{\overline q}=\left.\frac{\mathrm d^2 V}{\mathrm dq^2} \right|_{\overline q} \tag{9.24}
G = ∂ q ˙ 2 ∂ 2 L q = ∂ q ˙ 2 ∂ 2 T q , W = − ∂ q 2 ∂ 2 L q = d q 2 d 2 V q ( 9.24 )
通常动能总是正的即 G > 0 G>0 G > 0 ,因此稳定性要求
d 2 V d q 2 ∣ q ‾ > 0 (9.25) \left.\frac{\mathrm d^2V}{\mathrm dq^2}\right|_{\overline q}>0\tag{9.25}
d q 2 d 2 V q > 0 ( 9.25 )
结合式(9.23)和(9.25),若系统的势能在某位置有严格的极小值,则此位置是系统的稳定平衡位形。
Example 9.5 旋转圆环上的粒子与自发对称性破缺
如图所示,质量为 m m m 的粒子在半径为 R R R 的光滑圆环上运动,圆环水平高度固定,在外界驱动下绕着中心轴以恒定角速度 ω \omega ω 转动。这是一个单自由度的非定常系统。
取广义坐标为 θ \theta θ ,粒子的拉格朗日量为
L = 1 2 m R 2 ( θ ˙ 2 + ω 2 sin 2 θ ) + m g R cos θ ≡ 1 2 m R 2 θ ˙ 2 − V e f f ( θ ) L=\frac 12mR^2(\dot\theta^2+\omega^2\sin^2\theta)+mgR\cos\theta\equiv\frac 12mR^2\dot \theta^2-V_{eff}(\theta)
L = 2 1 m R 2 ( θ ˙ 2 + ω 2 sin 2 θ ) + m g R cos θ ≡ 2 1 m R 2 θ ˙ 2 − V e ff ( θ )
其中 V e f f ( θ ) V_{eff}(\theta) V e ff ( θ ) 为有效势能
V e f f ( θ ) = − 1 2 m R 2 ω 2 sin 2 θ − m g R cos θ V_{eff}(\theta)=-\frac 12mR^2\omega^2\sin^2\theta-mgR\cos\theta
V e ff ( θ ) = − 2 1 m R 2 ω 2 sin 2 θ − m g R cos θ
虽然这是非定常系统,但是因为拉格朗日量具有单自由度定常系统的形式,所以式(9.23)和(9.25)的条件是适用的。粒子的平衡位形对应有效势能的极值点 V e f f ′ ( θ ) = − m g R sin θ ( R ω 2 cos θ − g ) = 0 V'_{eff}(\theta)=-mgR\sin\theta(R\omega^2\cos\theta-g)=0 V e ff ′ ( θ ) = − m g R sin θ ( R ω 2 cos θ − g ) = 0 。根据角速度 ω \omega ω 与 g R \sqrt{\frac{g}{R}} R g 的大小,有两种情况。若 ω < g R \omega<\sqrt{\frac gR} ω < R g ,这时方程只有一个解 θ = 0 \theta=0 θ = 0 ,即圆环的最低点。因为 V e f f ′ ′ = − m R ( R ω 2 cos ( 2 θ ) − g cos θ ) , V e f f ′ ′ ( 0 ) = − m R 2 ω 2 ( 1 − g R ω 2 ) > 0 V''_{eff}=-mR(R\omega^2\cos(2\theta)-g\cos\theta),V''_{eff}(0)=-mR^2\omega^2(1-\frac{g}{R\omega^2})>0 V e ff ′′ = − m R ( R ω 2 cos ( 2 θ ) − g cos θ ) , V e ff ′′ ( 0 ) = − m R 2 ω 2 ( 1 − R ω 2 g ) > 0 ,因此 θ = 0 \theta=0 θ = 0 是稳定平衡位形。定义扰动 φ \varphi φ 为 θ = 0 + φ \theta=0+\varphi θ = 0 + φ ,则 φ \varphi φ 的二次拉格朗日量为
L 2 = 1 2 m R 2 φ ˙ 2 − 1 2 m R 2 ω 2 ( g R ω 2 − 1 ) φ 2 L_2=\frac 12mR^2\dot\varphi^2-\frac 12mR^2\omega^2\left(\frac{g}{R\omega^2}-1 \right)\varphi^2
L 2 = 2 1 m R 2 φ ˙ 2 − 2 1 m R 2 ω 2 ( R ω 2 g − 1 ) φ 2
若 ω ≥ g R \omega\ge\sqrt{\frac gR} ω ≥ R g ,此时,除了 θ = 0 \theta=0 θ = 0 ,出现另两个极值点 θ ± ≡ ± arccos ( g R ω 2 ) \theta_\pm\equiv \pm\arccos\left(\frac{g}{R\omega^2} \right) θ ± ≡ ± arccos ( R ω 2 g ) 。因为 V e f f ′ ′ ( 0 ) = − m R 2 ω 2 ( 1 − g R ω 2 ) < 0 V''_{eff}(0)=-mR^2\omega^2(1-\frac{g}{R\omega^2})<0 V e ff ′′ ( 0 ) = − m R 2 ω 2 ( 1 − R ω 2 g ) < 0 ,而 V e f f ′ ′ ( θ ± ) = m R 2 ω 2 ( 1 − g 2 R 2 ω 4 ) > 0 V''_{eff}(\theta_\pm)=mR^2\omega^2(1-\frac{g^2}{R^2\omega^4})>0 V e ff ′′ ( θ ± ) = m R 2 ω 2 ( 1 − R 2 ω 4 g 2 ) > 0 ,所以 θ ± \theta_\pm θ ± 是新的稳定平衡位形。定义扰动 φ \varphi φ 为 θ = θ ± + φ \theta=\theta_\pm+\varphi θ = θ ± + φ ,则 φ \varphi φ 的二次拉格朗日量为
L 2 = 1 2 m R 2 φ ˙ 2 − 1 2 m R 2 ω 2 ( 1 − g 2 R 2 ω 4 ) φ 2 L_2=\frac 12mR^2\dot \varphi^2-\frac 12mR^2\omega^2\left(1-\frac{g^2}{R^2\omega^4}\right)\varphi^2
L 2 = 2 1 m R 2 φ ˙ 2 − 2 1 m R 2 ω 2 ( 1 − R 2 ω 4 g 2 ) φ 2
有效势能在不同 ω \omega ω 取值如图所示。随着 ω \omega ω 的连续变化,粒子的稳定平衡位形出现了“突变”。
粒子的能量函数为 h = ∂ L ∂ θ ˙ θ ˙ − L = 1 2 m R 2 θ ˙ 2 + V e f f ( θ ) h=\frac{\partial L}{\partial \dot \theta}\dot \theta-L=\frac 12mR^2\dot \theta^2+V_{eff}(\theta) h = ∂ θ ˙ ∂ L θ ˙ − L = 2 1 m R 2 θ ˙ 2 + V e ff ( θ ) 。给定圆环转动的角速度 ω \omega ω ,稳定平衡位形处对应粒子能量函数的最小值,于是不妨将处于稳定平衡位形的状态称作“最低能量态”或基态 (ground state)。原始的拉格朗日式具有 θ → − θ \theta\to -\theta θ → − θ 变换下的对称性,当 ω < g R \omega<\sqrt\frac gR ω < R g 时,粒子基态 θ = 0 \theta=0 θ = 0 及扰动 φ \varphi φ 都”继承“了这种对称性。而当 ω ≥ g R \omega\ge \sqrt \frac gR ω ≥ R g 时,基态一分为二,且具有相同的能量,被称作简并 (degenerate)。此时 θ → − θ \theta\to-\theta θ → − θ 的对称性被打破,因为其将一个基态变成另一个基态。这种现象被称为自发对称性破缺 (sponraneous symmetry breaking)。粒子基态的能量函数 h 0 h_0 h 0 作为 ω \omega ω 的函数为
h 0 ( ω ) = { V e f f ( 0 ) = − m g R , ω < g R V e f f ( 0 ) = − 1 2 m R 2 ω 2 ( 1 + g 2 R 2 ω 4 ) , ω ≥ g R h_0(\omega)=
\begin{cases}
V_{eff}(0)=-mgR,&\omega<\sqrt \frac gR\\
V_{eff}(0)=-\frac 12 mR^2\omega^2\left(1+\frac{g^2}{R^2\omega^4} \right),&\omega\ge\sqrt\frac gR
\end{cases}
h 0 ( ω ) = { V e ff ( 0 ) = − m g R , V e ff ( 0 ) = − 2 1 m R 2 ω 2 ( 1 + R 2 ω 4 g 2 ) , ω < R g ω ≥ R g
这一现象可以和统计物理中的二级相变 (second order phase transition)类比,角速度 ω \omega ω 在这里扮演了温度的角色。
9.4.2 多自由度
对应非相对论性定常系统,平衡条件为
∂ V ∂ q a ∣ q ‾ = 0 (9.26) \left.\frac{\partial V}{\partial q^a}\right|_{\overline {\boldsymbol q}}=0 \tag{9.26}
∂ q a ∂ V q = 0 ( 9.26 )
此时位形 { q ‾ } \{\overline{\boldsymbol q}\} { q } 即平衡位形。对于平衡位形,由式(9.17)知,扰动的二次拉格朗日称为
L 2 = 1 2 G a b δ q ˙ a δ q ˙ b − 1 2 W a b δ q a δ q b (9.27) L_2=\frac 12G_{ab}\delta \dot q^a\delta\dot q^b-\frac 12 W_{ab}\delta q^a\delta q^b \tag{9.27}
L 2 = 2 1 G ab δ q ˙ a δ q ˙ b − 2 1 W ab δ q a δ q b ( 9.27 )
其中
G a b = ∂ 2 T ∂ q ˙ a ∂ q ˙ b ∣ q ‾ , W a b = ∂ 2 V ∂ q a ∂ q b ∣ q ‾ G_{ab}=\left.\frac{\partial ^2T}{\partial \dot q^a\partial \dot q^b}\right|_{\overline{\boldsymbol q}},\quad W_{ab}=\left.\frac{\partial ^2V}{\partial q^a\partial q^b} \right|_{\overline{\boldsymbol q}}
G ab = ∂ q ˙ a ∂ q ˙ b ∂ 2 T q , W ab = ∂ q a ∂ q b ∂ 2 V q
都是常矩阵。总要求动能是正的,即 T = 1 2 G a b δ q ˙ a δ q ˙ b > 0 T=\frac 12G_{ab}\delta \dot q^a\delta \dot q^b>0 T = 2 1 G ab δ q ˙ a δ q ˙ b > 0 ,这就要求矩阵 G a b G_{ab} G ab 必须是正定 (positive definite)的。这时,稳定性要求 W a b W_{ab} W ab (即势能 V V V 的黑塞矩阵(Hessian matrid))也是正定的。
Chapter 10 小振动
如果背景是稳定的,则扰动不会随着时间无限增大。此时系统的位形始终围绕着背景做往复的运动,这种运动形式即小振动 (small oscillation)。
10.1 自由振动
10.1.1 单自由度
考虑单自由度保守系统在稳定平衡位形附近的微扰展开。扰动的二次作用量为
S 2 [ q ] = ∫ d t ( 1 2 G q ˙ 2 − 1 2 W q 2 ) (10.1) S_2[q]=\int\mathrm dt\left(\frac 12G\dot q^2-\frac 12 Wq^2 \right)\tag{10.1}
S 2 [ q ] = ∫ d t ( 2 1 G q ˙ 2 − 2 1 W q 2 ) ( 10.1 )
在本章中,因为讨论的都是扰动,简洁起见略去 " δ \delta δ “ 符号,记扰动为 q q q 或 q a q^a q a 。对 S 2 [ q ] S_2[q] S 2 [ q ] 变分得到线性运动方程
G q ¨ + W q = 0 ⇒ q ¨ + ω 2 q = 0 (10.2) G\ddot q+Wq=0\quad \Rightarrow \quad \ddot q+\omega^2q=0 \tag{10.2}
G q ¨ + W q = 0 ⇒ q ¨ + ω 2 q = 0 ( 10.2 )
方程(10.2)描述角频率为 ω = W G \omega=\sqrt\frac{W}{G} ω = G W 的谐振动 (harmonic oscillation)。谐振动式物理系统在稳定平衡位形附近运动的普遍形式。
方程(10.2)有两个线性无关的特解,可取为
{ sin ( ω t ) , cos ( ω t ) } or { e − i ω t , e + i ω t } (10.3) \{\sin(\omega t),\cos(\omega t) \}\quad \text{or}\quad \{e^{-\mathrm i \omega t},e^{+\mathrm i\omega t}\} \tag{10.3}
{ sin ( ω t ) , cos ( ω t )} or { e − i ω t , e + i ω t } ( 10.3 )
其中 ω \omega ω 即振动的角频率。通解的一般形式为
q ( t ) = A e − i ω t + A ∗ e + i ω t ≡ A e − i ω t + c . c . (10.4) q(t)=Ae^{-\mathrm i\omega t}+A^*e^{+\mathrm i\omega t}\equiv Ae^{-\mathrm i\omega t }+\mathrm {c.c.} \tag{10.4}
q ( t ) = A e − i ω t + A ∗ e + i ω t ≡ A e − i ω t + c.c. ( 10.4 )
其中 A A A 是常数,c . c . \mathrm{c.c.} c.c. 表示复共轭。对于振动方程,物理上经常取两个线性无光的特解为
{ u ( t ) , u ∗ ( t ) } (10.6) \{u(t),u^*(t) \} \tag{10.6}
{ u ( t ) , u ∗ ( t )} ( 10.6 )
这里 u ( t ) u(t) u ( t ) 是复函数,被称为模式函数 (mode function)。方程的通解为两者的线性组合
q ( t ) = A u ( t ) + A ∗ u ∗ ( t ) ≡ A u ( t ) + c . c . (10.7) q(t)=Au(t)+A^*u^*(t)\equiv Au(t)+\mathrm{c.c.}\tag{10.7}
q ( t ) = A u ( t ) + A ∗ u ∗ ( t ) ≡ A u ( t ) + c.c. ( 10.7 )
其中 A A A 是复常数。
10.1.2 简正模式
单自由度谐振动的讨论向一般多自由度系统的推广是直接的。出发点为扰动的二次拉格朗日量式
L 2 = 1 2 G a b q ˙ a q ˙ b − 1 2 W a b q a q b (10.8) L_2=\frac 12G_{ab}\dot q^a\dot q^b-\frac 12W_{ab}q^aq^b \tag{10.8}
L 2 = 2 1 G ab q ˙ a q ˙ b − 2 1 W ab q a q b ( 10.8 )
运动方程为
G a b q ¨ b + W a b q b = 0 , a = 1 , ⋯ , s (10.9) G_{ab}\ddot q^b+W_{ab}q^b=0,\quad a=1,\cdots,s \tag{10.9}
G ab q ¨ b + W ab q b = 0 , a = 1 , ⋯ , s ( 10.9 )
将扰动记为矩阵
q ≡ ( q a ⋮ q s ) (10.10) \boldsymbol q\equiv
\begin{pmatrix}
q^a\\
\vdots\\
q^s
\end{pmatrix}\tag{10.10}
q ≡ q a ⋮ q s ( 10.10 )
则式(10.8)用矩阵形式写成
L 2 = 1 2 q ˙ T G q ˙ − 1 2 q T W q (10.11) L_2=\frac 12 \dot{\boldsymbol q}^T \boldsymbol G\dot{\boldsymbol q}-\frac 12\boldsymbol q^T\boldsymbol W\boldsymbol q\tag{10.11}
L 2 = 2 1 q ˙ T G q ˙ − 2 1 q T W q ( 10.11 )
其中 G \boldsymbol G G 和 W \boldsymbol W W 都是常对称矩阵,且我们假设都是非退化且正定的。运动方程(10.10)的矩阵形式为
G q ¨ + W q = 0 (10.12) \boldsymbol G\ddot{\boldsymbol q}+\boldsymbol W\boldsymbol q=0\tag{10.12}
G q ¨ + W q = 0 ( 10.12 )
我们猜测其也具有谐振子形式的解
q ( t ) = A e − i ω t + A ∗ e + i ω t = A e − i ω t + c . c . (10.13) \boldsymbol q(t)=\boldsymbol Ae^{-\mathrm i\omega t}+\boldsymbol A^*e^{+\mathrm i\omega t}=\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}\tag{10.13}
q ( t ) = A e − i ω t + A ∗ e + i ω t = A e − i ω t + c.c. ( 10.13 )
这里
A = ( A 1 ⋮ A s ) (10.14) \boldsymbol A=\begin{pmatrix}
A^1\\
\vdots\\
A^s
\end{pmatrix}\tag{10.14}
A = A 1 ⋮ A s ( 10.14 )
是常矢量,矩阵元可以是复数。
将式(10.13)代入运动方程(10.12)中,利用
q ¨ = − ω 2 A e − i ω t + c . c . = − ω 2 q (10.15) \ddot{\boldsymbol q}=-\omega^2\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}=-\omega^2\boldsymbol q \tag{10.15}
q ¨ = − ω 2 A e − i ω t + c.c. = − ω 2 q ( 10.15 )
得到
G q ¨ + W q = ( W − ω 2 G ) A e − i ω t + c . c . = 0 (10.16) \boldsymbol G\ddot{\boldsymbol q}+\boldsymbol W\boldsymbol q=(\boldsymbol W-\omega^2\boldsymbol G)\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}=0\tag{10.16}
G q ¨ + W q = ( W − ω 2 G ) A e − i ω t + c.c. = 0 ( 10.16 )
即必须有
( W − ω 2 G ) A = 0 (10.17) (\boldsymbol W-\omega^2\boldsymbol G)\boldsymbol A=0\tag{10.17}
( W − ω 2 G ) A = 0 ( 10.17 )
式(10.17)是矩阵 W − ω 2 G \boldsymbol W-\omega^2\boldsymbol G W − ω 2 G 的本征方程,且表明 A \boldsymbol A A 是矩阵 W − ω 2 G \boldsymbol W-\omega^2G W − ω 2 G 的零本征矢 (null eigenvector)。因为我们需要寻找 A ≠ 0 \boldsymbol A\neq0 A = 0 的非平庸解,因此式(10.17)成立的充分必要条件是,矩阵 W − ω 2 G \boldsymbol W-\omega^2G W − ω 2 G 退化。这意味着行列式为零
det ( W − ω 2 G ) = 0 (10.18) \det(\boldsymbol W-\omega^2\boldsymbol G)=0\tag{10.18}
det ( W − ω 2 G ) = 0 ( 10.18 )
式(10.18)被称为自由度 s s s 的小振动系统的特征方程 (characteristic equation)。
矩阵 W − ω 2 G = 0 \boldsymbol W-\omega^2\boldsymbol G=0 W − ω 2 G = 0 是 s × s s\times s s × s 的方阵,因此特征方程(10.18)是 ω 2 \omega^2 ω 2 的 s s s 次代数方程。因为背景是稳定平衡的,即要求 W \boldsymbol W W 和 G \boldsymbol G G 都是正定的,因此 ω 2 \omega^2 ω 2 的解都是正实数,即式(10.18)总存在 ω 2 \omega^2 ω 2 的 s s s 个正实根 ω 1 2 , ω 2 2 , ⋯ , ω s 2 \omega_1^2,\omega_2^2,\cdots,\omega_s^2 ω 1 2 , ω 2 2 , ⋯ , ω s 2 。对应 s s s 个振动频率
ω α , α = 1 , ⋯ , s (10.19) \omega_\alpha,\quad \alpha=1,\cdots,s\tag{10.19}
ω α , α = 1 , ⋯ , s ( 10.19 )
被称为小振动系统的特征频率 (characteristic frequencies)。
现在假定我们已经求解了特征方程(10.18),即找到了 s s s 个振动频率式(10.19)。其中每一个给定频率 ω α \omega_\alpha ω α 都具有式(10.13)形式的试解,即
q α ( t ) = A α e − i ω t + c . c . , α = 1 , ⋯ , s (10.20) \boldsymbol q_\alpha(t)=\boldsymbol A_\alpha e^{-\mathrm i\omega t}+\mathrm{c.c.},\quad \alpha=1,\cdots,s \tag{10.20}
q α ( t ) = A α e − i ω t + c.c. , α = 1 , ⋯ , s ( 10.20 )
都是系统运动方程可能的解。但是其中的系数即矢量 A α \boldsymbol A_\alpha A α 并不是任意的,因为式(10.17)表明 A \boldsymbol A A 必须是 W − ω 2 G \boldsymbol W-\omega^2\boldsymbol G W − ω 2 G 的零本征矢。具体而言,对于给定的某一特征频率,有
( W − ω α 2 G ) A α = 0 , a = 1 , ⋯ , s (10.21) (\boldsymbol W-\omega_\alpha^2\boldsymbol G)\boldsymbol A_\alpha=0,\quad a=1,\cdots,s \tag{10.21}
( W − ω α 2 G ) A α = 0 , a = 1 , ⋯ , s ( 10.21 )
满足式(10.24)的 A α \boldsymbol A_\alpha A α 被称作某一特征频率 ω α \omega_\alpha ω α 对于的特征矢量 (characteristic vector)。因为 G \boldsymbol G G 是非退化的,将式(10.21)两边同乘以 G − 1 \boldsymbol G^{-1} G − 1 ,得到
G − 1 W A α = ω α 2 A α (10.22) \boldsymbol G^{-1}\boldsymbol W\boldsymbol A_\alpha=\omega_\alpha^2 \boldsymbol A_{\alpha} \tag{10.22}
G − 1 W A α = ω α 2 A α ( 10.22 )
所以矩阵 G − 1 W \boldsymbol G^{-1}\boldsymbol W G − 1 W 的本征值为特征频率的平方 ω α 2 \omega_{\alpha}^2 ω α 2 ,对应的本征矢正是特征矢量 A α \boldsymbol A_{\alpha} A α 。这时,形如式(10.20)的解 q α \boldsymbol q_\alpha q α 的物理意义是,所有的自由度以同一频率 ω α \omega_\alpha ω α 作谐振动,且系数 A α \boldsymbol A_{\alpha} A α 必须满足式(10.21)。这意味着各自由度的振幅满足固定的比例关系。这组同一频率的解被称作系统的简正模式 (normal mode)。需要强调的是,简正模式是对所有自由度而言的”一组“解,而不是某个自由度的解。
因为运动方程是线性的,所以两个解的叠加仍然是方程的解。当简正模式选定后,系统运动方程的通解即所有简正模式的线性叠加:
q ( t ) = ∑ α = 1 s C α e − i ϕ α ⏟ 系数 A α e − i ω α t ⏟ 简正模式 + c . c . (10.23) \boldsymbol q(t)=\sum_{\alpha=1}^s\underbrace{C_\alpha e^{-\mathrm i\phi_{\alpha}}}_{系数}\underbrace{\boldsymbol A_{\alpha}e^{-\mathrm i\omega_\alpha t}}_{简正模式}+\mathrm{c.c.} \tag{10.23}
q ( t ) = α = 1 ∑ s 系数 C α e − i ϕ α 简正模式 A α e − i ω α t + c.c. ( 10.23 )
其中系数 C α C_{\alpha} C α 和 ϕ α \phi_{\alpha} ϕ α 都是常实数,分别对应各个简正模式叠加的幅度和相位。总共 2 s 2s 2 s 个待定实常数,正好对应自由度 s s s 系统作线性振动的 2 s 2s 2 s 个初始条件。
可以总结以下多自由度系统自由振动的求解步骤:
(1)写出系统二次拉格朗日量中的 G \boldsymbol G G 和 W \boldsymbol W W 矩阵
(2)根据特征方程(10.18),求特征频率 ω α \omega_{\alpha} ω α
(3)对每一个特征频率,根据式(10.22)求对应的特征矢量 A α \boldsymbol A_{\alpha} A α ,得到简正模式
(4)根据式(10.23)对所有的简正模式求和,得到通解
(5)根据初始条件,确定待定系数。
Example 10.1 弹簧连接的两个单摆的简正模式
如图所示,两个全同的单摆由无质量的弹簧连接,摆长为 l l l ,摆球质量为 m m m ,单摆顶端相距为 d d d ,假设弹簧的自由长度也是 d d d 。
选取摆杆与竖直方向的夹角 θ 1 \theta_1 θ 1 和 θ 2 \theta_2 θ 2 为广义坐标,由直角坐标关系 x 1 = l sin θ 1 x_1=l\sin\theta_1 x 1 = l sin θ 1 ,y 1 = − l cos θ 1 y_1=-l\cos\theta_1 y 1 = − l cos θ 1 ,x 2 = d + l sin θ 2 x_2=d+l\sin\theta_2 x 2 = d + l sin θ 2 ,y 2 = − l cos θ 2 y_2=-l\cos\theta_2 y 2 = − l cos θ 2 ,系统的拉格朗日量为
L = T − V = 1 2 m ( x ˙ 1 2 + y ˙ 1 2 ) + 1 2 m ( x ˙ 2 2 + y ˙ 2 2 ) − m g y 1 − m g y 2 − 1 2 k ( ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2 − d ) 2 = 1 2 m l 2 θ ˙ 1 2 + 1 2 m l 2 θ ˙ 2 2 + m g l cos θ 1 + m g l cos θ 2 − 1 2 k ( ( d − l sin θ 1 + l sin θ 2 ) 2 + ( l cos θ 1 − l cos θ 2 ) 2 − d ) 2 \begin{aligned}
L=T-V=&\frac12m(\dot x_1^2+\dot y_1^2)+\frac 12m(\dot x_2^2+\dot y_2^2)-mgy_1-mgy_2 \\
&-\frac 12 k\left(\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}-d\right)^2 \\
=&\frac 12ml^2\dot\theta_1^2+\frac 12ml^2\dot\theta_2^2+mgl\cos\theta_1+mgl\cos\theta_2 \\
&-\frac 12k\left(\sqrt{(d-l\sin\theta_1+l\sin\theta_2)^2+(l\cos\theta_1-l\cos\theta_2)^2} -d\right)^2
\end{aligned}
L = T − V = = 2 1 m ( x ˙ 1 2 + y ˙ 1 2 ) + 2 1 m ( x ˙ 2 2 + y ˙ 2 2 ) − m g y 1 − m g y 2 − 2 1 k ( ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2 − d ) 2 2 1 m l 2 θ ˙ 1 2 + 2 1 m l 2 θ ˙ 2 2 + m g l cos θ 1 + m g l cos θ 2 − 2 1 k ( ( d − l sin θ 1 + l sin θ 2 ) 2 + ( l cos θ 1 − l cos θ 2 ) 2 − d ) 2
因为平衡位形 θ ‾ 1 = θ ‾ 2 = 0 \overline \theta_1=\overline \theta_2=0 θ 1 = θ 2 = 0 ,即扰动为 θ 1 = 0 + ϕ 1 \theta_1=0+\phi_1 θ 1 = 0 + ϕ 1 ,θ 2 = 0 + ϕ 2 \theta_2=0+\phi_2 θ 2 = 0 + ϕ 2 ,展开得到二次拉格朗日量
L 2 = 1 2 m l 2 ϕ ˙ 1 2 + 1 2 m l 2 ϕ ˙ 2 2 − 1 2 ( m g l + k l 2 ) ϕ 1 2 − 1 2 ( m g l + k l 2 ) ϕ 2 2 + k l 2 ϕ 1 ϕ 2 L_2=\frac12ml^2\dot\phi_1^2+\frac12ml^2\dot\phi_2^2-\frac12(mgl+kl^2)\phi_1^2-\frac 12(mgl+kl^2)\phi_2^2+kl^2\phi_1\phi_2
L 2 = 2 1 m l 2 ϕ ˙ 1 2 + 2 1 m l 2 ϕ ˙ 2 2 − 2 1 ( m g l + k l 2 ) ϕ 1 2 − 2 1 ( m g l + k l 2 ) ϕ 2 2 + k l 2 ϕ 1 ϕ 2
记 q = ( ϕ 1 , ϕ 2 ) T \boldsymbol q=(\phi_1,\phi_2)^T q = ( ϕ 1 , ϕ 2 ) T ,以及
G = m l 2 ( 1 0 0 1 ) , W = ( m g l + k l 2 − k l 2 − k l 2 m g l + k l 2 ) \boldsymbol G=ml^2\begin{pmatrix}
1&0\\
0& 1
\end{pmatrix},\quad
\boldsymbol W=\begin{pmatrix}
mgl+kl^2&-kl^2\\
-kl^2&mgl+kl^2
\end{pmatrix}
G = m l 2 ( 1 0 0 1 ) , W = ( m g l + k l 2 − k l 2 − k l 2 m g l + k l 2 )
特征方程为
0 = det ( W − ω 2 G ) = ( m g l + k l 2 − m ω 2 l 2 − k l 2 − k l 2 m g l + k l 2 − m ω 2 l 2 ) = m l 2 ( g − ω 2 l ) ( m g + 2 k l − m ω l ) \begin{aligned}
0=\det(\boldsymbol W-\omega^2\boldsymbol G)=&\begin{pmatrix}
mgl+kl^2-m\omega^2 l^2&-kl^2\\
-kl^2&mgl+kl^2-m\omega^2l^2
\end{pmatrix}\\
=&ml^2(g-\omega^2l)(mg+2kl-m\omega l)
\end{aligned}
0 = det ( W − ω 2 G ) = = ( m g l + k l 2 − m ω 2 l 2 − k l 2 − k l 2 m g l + k l 2 − m ω 2 l 2 ) m l 2 ( g − ω 2 l ) ( m g + 2 k l − mω l )
解的
ω 1 2 = g l , ω 2 2 = m g + 2 k l m l \omega_1^2=\frac{g}l,\quad \omega_2^2=\frac{mg+2kl}{ml}
ω 1 2 = l g , ω 2 2 = m l m g + 2 k l
对应的特征矢量分别为
A 1 = ( 1 1 ) , A 2 = ( 1 − 1 ) \boldsymbol A_1=\begin{pmatrix}
1 \\
1
\end{pmatrix},\quad
\boldsymbol A_2=\begin{pmatrix}
1\\-1
\end{pmatrix}
A 1 = ( 1 1 ) , A 2 = ( 1 − 1 )
于是通解记
( ϕ 1 ϕ 2 ) = C 1 e − i α 1 ( 1 1 ) e − i g / l t + C 2 e − i α 2 ( 1 − 1 ) e − i g / l + 2 k / m t + c . c , \begin{pmatrix}
\phi_1\\
\phi_2
\end{pmatrix}=
C_1e^{-\mathrm i\alpha_1}\begin{pmatrix}
1\\1
\end{pmatrix}e^{-\mathrm i\sqrt{g/l}t}+C_2e^{-\mathrm i\alpha_2}\begin{pmatrix}
1\\-1
\end{pmatrix}e^{-\mathrm i\sqrt{g/l+2k/m}t}+\mathrm{c.c,}
( ϕ 1 ϕ 2 ) = C 1 e − i α 1 ( 1 1 ) e − i g / l t + C 2 e − i α 2 ( 1 − 1 ) e − i g / l + 2 k / m t + c.c ,
其中 C 1 C_1 C 1 ,C 2 C_2 C 2 ,α 1 \alpha_1 α 1 ,α 2 \alpha_2 α 2 为 4 个实常数。
10.1.3 简正坐标
作用量式(10.11)中矩阵 G \boldsymbol G G 和 W \boldsymbol W W 不是对角化的,所以不同的自由度出现了”耦合“,导致最终单个自由度中不同的特征频率被混合在一起。所以问题归结为,如何选取一组新的广义坐标 ζ \boldsymbol \zeta ζ ,满足
q = M ζ (10.24) \boldsymbol q=\boldsymbol M\boldsymbol \zeta\tag{10.24}
q = M ζ ( 10.24 )
其中 M \boldsymbol M M 是常矩阵,使得用新的广义坐标 { ζ } \{\zeta\} { ζ } 表达的拉格朗日量中,新的动能项系数矩阵和势能项系数矩阵同时对角化。在这样的线性变换下,二次拉格朗日量变换为
L 2 = 1 2 ζ ˙ T G ~ ζ ˙ − 1 2 ζ T W ~ ζ (10.25) L_2=\frac 12\dot {\boldsymbol \zeta}^T\tilde{\boldsymbol G}\dot{\boldsymbol \zeta}-\frac12 \boldsymbol\zeta^T\tilde{\boldsymbol W}\boldsymbol \zeta\tag{10.25}
L 2 = 2 1 ζ ˙ T G ~ ζ ˙ − 2 1 ζ T W ~ ζ ( 10.25 )
其中
G ~ = M T G M , W ~ = M T W M (10.26) \tilde{\boldsymbol G}=\boldsymbol M^T\boldsymbol G\boldsymbol M,\quad \tilde{\boldsymbol W}=\boldsymbol M^TW\boldsymbol M \tag{10.26}
G ~ = M T G M , W ~ = M T W M ( 10.26 )
ζ \boldsymbol \zeta ζ 的运动方程为
ζ ¨ + G ~ − 1 W ~ ζ = 0 (10.27) \ddot{\boldsymbol \zeta}+\tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W}\boldsymbol \zeta=0\tag{10.27}
ζ ¨ + G ~ − 1 W ~ ζ = 0 ( 10.27 )
为了使新的广义坐标 ζ \boldsymbol \zeta ζ 之间互相独立,则 G ~ \tilde{\boldsymbol G} G ~ 和 W ~ \tilde{\boldsymbol W} W ~ 必须都称为对角矩阵。由线性代数知,对于两个正定的实对称矩阵,一定存在线性变换使得其同时对角化。因此总是存在 M \boldsymbol M M ,使得变换后
G ~ = ( g 1 g 2 ⋱ g 2 ) , W ~ = ( w 1 w 2 ⋱ w s ) (10.28) \tilde{\boldsymbol G}=\begin{pmatrix}
g_1\\
& g_2\\
& & \ddots\\
&&&& g_2
\end{pmatrix},\quad
\tilde{\boldsymbol W}=\begin{pmatrix}
w_1\\
& w_2\\
&&\ddots\\
&&& w_s
\end{pmatrix}\tag{10.28}
G ~ = g 1 g 2 ⋱ g 2 , W ~ = w 1 w 2 ⋱ w s ( 10.28 )
从而
G ~ − 1 W ~ = ( w 1 g 1 w 2 g 2 ⋱ w s g s ) (10.29) \tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W}=\begin{pmatrix}
\frac {w_1} {g_1}\\
& \frac{w_2}{g_2}\\
&&\ddots\\
&&& \frac{w_s}{g_s}
\end{pmatrix}\tag{10.29}
G ~ − 1 W ~ = g 1 w 1 g 2 w 2 ⋱ g s w s ( 10.29 )
于是运动方程(10.27)成为
ζ ¨ α + w α g α ζ α = 0 , α = 1 , ⋯ , s (10.30) \ddot\zeta_\alpha+\frac{w_\alpha}{g_\alpha}\zeta_\alpha=0,\quad \alpha=1,\cdots,s\tag{10.30}
ζ ¨ α + g α w α ζ α = 0 , α = 1 , ⋯ , s ( 10.30 )
显然 G ~ − 1 W ~ \tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W} G ~ − 1 W ~ 与 G − 1 W {\boldsymbol G}^{-1}{\boldsymbol W} G − 1 W 有相同的本征值,即有
w α g α = ω α 2 (10.31) \frac{w_\alpha}{g_\alpha}=\omega_\alpha^2\tag{10.31}
g α w α = ω α 2 ( 10.31 )
因此式(10.27)的通解为
ζ α = C α e − i ϕ α e − i ω α t + c . c . (10.32) \zeta_\alpha=C_\alpha e^{-\mathrm i\phi_\alpha}e^{-\mathrm i\omega_\alpha t}+\mathrm{c.c.}\tag{10.32}
ζ α = C α e − i ϕ α e − i ω α t + c.c. ( 10.32 )
其中 C α , ϕ α C_\alpha,\phi_\alpha C α , ϕ α 是实常数。{ ζ } \{\zeta\} { ζ } 被称为简正坐标 (normal coordinates)。
现在的问题是,如何寻找用来将 G \boldsymbol G G 和 W \boldsymbol W W 同时对角化的线性变换矩阵 M \boldsymbol M M ?我们可以利用此前求的的 s s s 个特征矢量 { A α } \{\boldsymbol A_\alpha\} { A α } 。因为 G \boldsymbol G G 是非退化对称矩阵,于是可以用 G \boldsymbol G G 作为”度规“来定义两矢量的内积
< A , B > : = A T G B (10.33) <\boldsymbol A,\boldsymbol B>:=\boldsymbol A^T\boldsymbol G\boldsymbol B \tag{10.33}
< A , B >:= A T G B ( 10.33 )
不妨称这个内积为 “G \boldsymbol G G -内积” .于是总是可以选取 s s s 个线性独立的特征矢量,使得其在 “G \boldsymbol G G -内积” 的意义下正交归一,即满足
< A α , A β > ≡ A α T G A β = δ α β , α , β = 1 , ⋯ , s (10.34) <\boldsymbol A_\alpha,\boldsymbol A_\beta>\equiv \boldsymbol A_\alpha^T\boldsymbol G\boldsymbol A_\beta=\delta_{\alpha\beta},\quad \alpha,\beta=1,\cdots,s\tag{10.34}
< A α , A β >≡ A α T G A β = δ α β , α , β = 1 , ⋯ , s ( 10.34 )
proof:
对于同一特征值 ω α \omega_\alpha ω α 的特征矢量 A α 1 , ⋯ , A α k \boldsymbol A_{\alpha1},\cdots,\boldsymbol A_{\alpha k} A α 1 , ⋯ , A α k ,显然可以通过格拉姆-施密特正交化(Gram-Schmidt orthogonalization)实现在 ”G G G -内积“ 的意义下正交归一:
A α 1 ′ = A α 1 ⋮ A ′ α k = A α k − ∑ i = 1 k − 1 < A α k , A α i > < A α i , A α i > A ’ α i \begin{aligned}
{\boldsymbol A}'_{\alpha1}=&\boldsymbol A_{\alpha 1}\\
&\vdots\\
{\boldsymbol A'}_{\alpha k}=&\boldsymbol A_{\alpha k}-\sum_{i=1}^{k-1}\frac{<\boldsymbol A_{\alpha k},\boldsymbol A_{\alpha i}>}{<\boldsymbol A_{\alpha i},\boldsymbol A_{\alpha i}>}\boldsymbol A’_{\alpha i}
\end{aligned}
A α 1 ′ = A ′ α k = A α 1 ⋮ A α k − i = 1 ∑ k − 1 < A α i , A α i > < A α k , A α i > A ’ α i
再令
A ~ α k = 1 < A α k , A α k > A α k ′ \tilde{\boldsymbol A}_{\alpha k}=\frac{1}{<\boldsymbol A_{\alpha k},\boldsymbol A_{\alpha k}>}\boldsymbol A'_{\alpha k}
A ~ α k = < A α k , A α k > 1 A α k ′
即可。
对于不同特征值 ω α \omega_{\alpha} ω α 和 ω β \omega_{\beta} ω β 的两个特征矢量 A α \boldsymbol A_{\alpha} A α 和 A β \boldsymbol A_{\beta} A β 可以证明
< A α , A β > = 0 <\boldsymbol A_{\alpha},\boldsymbol A_\beta>=0
< A α , A β >= 0
考虑
G − 1 W A α = ω α A α , G − 1 W A β = ω β A β \boldsymbol G^{-1}\boldsymbol W\boldsymbol A_{\alpha}=\omega_\alpha \boldsymbol A_{\alpha},\quad \boldsymbol G^{-1}\boldsymbol W\boldsymbol A_{\beta}=\omega_\beta \boldsymbol A_{\beta}
G − 1 W A α = ω α A α , G − 1 W A β = ω β A β
有
ω α < A β , A α > = A β T W A α = ( A β T W ) A α = ω β < A β , A α > \omega_{\alpha}<\boldsymbol A_{\beta},\boldsymbol A_\alpha>= \boldsymbol A_\beta^{T} \boldsymbol W A_{\alpha}=(\boldsymbol A_\beta^{T} \boldsymbol W) A_{\alpha}=\omega_\beta<\boldsymbol A_\beta,\boldsymbol A_\alpha>
ω α < A β , A α >= A β T W A α = ( A β T W ) A α = ω β < A β , A α >
所以
< A α , A β > = 0 <\boldsymbol A_\alpha,\boldsymbol A_\beta>=0
< A α , A β >= 0
于是将这 s s s 个正交归一的特征矢量每一个作为”列“,排成方阵
M = ( A 1 A 2 ⋯ A s ) = ( A 1 1 A 2 1 ⋯ A s 1 A 1 2 A 2 2 ⋯ A s 2 ⋮ ⋮ ⋮ A 1 s A 2 s ⋯ A s s ) (10.35) \boldsymbol M=\begin{pmatrix}
\boldsymbol A_1 & \boldsymbol A_2& \cdots &\boldsymbol A_s
\end{pmatrix}=\begin{pmatrix}
\boldsymbol A_1^1 & \boldsymbol A_2^1& \cdots &\boldsymbol A_s^1\\
\boldsymbol A_1^2 & \boldsymbol A_2^2& \cdots &\boldsymbol A_s^2\\
\vdots & \vdots& &\vdots\\
\boldsymbol A_1^s & \boldsymbol A_2^s& \cdots &\boldsymbol A_s^s\\
\end{pmatrix}\tag{10.35}
M = ( A 1 A 2 ⋯ A s ) = A 1 1 A 1 2 ⋮ A 1 s A 2 1 A 2 2 ⋮ A 2 s ⋯ ⋯ ⋯ A s 1 A s 2 ⋮ A s s ( 10.35 )
这样构成的方阵被称为模态矩阵 (modal matrix),用指标来写即
M α a = A α a , a , α = 1 , ⋯ , s (10.36) M^a_\alpha=A_\alpha^a,\quad a,\alpha=1,\cdots,s\tag{10.36}
M α a = A α a , a , α = 1 , ⋯ , s ( 10.36 )
其中 A α a A_\alpha^a A α a 表示第 α \alpha α 个矢量的 a a a 分量。原始的广义坐标和简正坐标之间的关系为
q a = M α a ζ α = A α a ζ α , α = 1 , ⋯ , s (10.37) q^a=M_\alpha^a\zeta_\alpha=A_\alpha^a\zeta_\alpha\tag{10.37},\quad \alpha=1,\cdots,s
q a = M α a ζ α = A α a ζ α , α = 1 , ⋯ , s ( 10.37 )
可以验证模态矩阵 M \boldsymbol M M 可将 G \boldsymbol G G 和 M \boldsymbol M M 同时对角化,有
G ~ = M T G M = ( A 1 T A 2 T ⋮ A s T ) G ( A 1 A 2 ⋯ A s ) = ( A 1 T G A 1 A 1 T G A 2 ⋯ A 1 T G A s A 2 T G A 1 A 2 T G A 2 ⋯ A 2 T G A s ⋮ ⋮ ⋮ A s T G A 1 A s T G A 2 ⋯ A s T G A s ) = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ 1 ) (10.38) \begin{aligned}
\tilde{\boldsymbol G}=&\boldsymbol M^T \boldsymbol G\boldsymbol M=\begin{pmatrix}
\boldsymbol A_1^T\\
\boldsymbol A_2^T\\
\vdots\\
\boldsymbol A_s^T
\end{pmatrix}\boldsymbol G\begin{pmatrix}
\boldsymbol A_1 & \boldsymbol A_2 & \cdots &\boldsymbol A_s
\end{pmatrix}\\
=&\begin{pmatrix}
\boldsymbol A_1^T\boldsymbol G \boldsymbol A_1 & \boldsymbol A_1^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_1^T\boldsymbol G\boldsymbol A_s\\
\boldsymbol A_2^T\boldsymbol G\boldsymbol A_1 &\boldsymbol A_2^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_2^T\boldsymbol G\boldsymbol A_s\\
\vdots&\vdots&&\vdots\\
\boldsymbol A_s^T\boldsymbol G\boldsymbol A_1&\boldsymbol A_s^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_s^T\boldsymbol G\boldsymbol A_s
\end{pmatrix}=\begin{pmatrix}
1 & 0 &\cdots & 0\\
0 & 1 & \cdots & 0\\
\vdots &\vdots &&\vdots\\
0&0&\cdots &1
\end{pmatrix}
\end{aligned}\tag{10.38}
G ~ = = M T G M = A 1 T A 2 T ⋮ A s T G ( A 1 A 2 ⋯ A s ) A 1 T G A 1 A 2 T G A 1 ⋮ A s T G A 1 A 1 T G A 2 A 2 T G A 2 ⋮ A s T G A 2 ⋯ ⋯ ⋯ A 1 T G A s A 2 T G A s ⋮ A s T G A s = 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋯ 0 0 ⋮ 1 ( 10.38 )
另一方面,有
A α T ( W − ω β 2 G ) A β = 0 (10.39) \boldsymbol A_\alpha^T(\boldsymbol W-\omega^2_\beta\boldsymbol G)\boldsymbol A_\beta=0\tag{10.39}
A α T ( W − ω β 2 G ) A β = 0 ( 10.39 )
即
A α T W A β = ω β 2 δ α β (10.40) \boldsymbol A_\alpha^T\boldsymbol W\boldsymbol A_\beta=\omega^2_\beta\delta_{\alpha\beta}\tag{10.40}
A α T W A β = ω β 2 δ α β ( 10.40 )
于是
W ~ = M T W M = ( A 1 T W A 1 A 1 T W A 2 ⋯ A 1 T W A s A 2 T W A 1 A 2 T W A 2 ⋯ A 2 T W A s ⋮ ⋮ ⋮ A s T W A 1 A s T W A 2 ⋯ A s T W A s ) = ( ω 1 2 0 ⋯ 0 0 ω 2 2 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ ω s 2 ) (10.41) \begin{aligned}
\tilde{\boldsymbol W}=&\boldsymbol M^T\boldsymbol W\boldsymbol M=
\begin{pmatrix}
\boldsymbol A_1^T\boldsymbol W \boldsymbol A_1 & \boldsymbol A_1^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_1^T\boldsymbol W\boldsymbol A_s\\
\boldsymbol A_2^T\boldsymbol W\boldsymbol A_1 &\boldsymbol A_2^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_2^T\boldsymbol W\boldsymbol A_s\\
\vdots&\vdots&&\vdots\\
\boldsymbol A_s^T\boldsymbol W\boldsymbol A_1&\boldsymbol A_s^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_s^T\boldsymbol W\boldsymbol A_s
\end{pmatrix}\\
=&\begin{pmatrix}
\omega_1^2 & 0&\cdots&0\\
0 &\omega_2^2&\cdots&0\\
\vdots&\vdots&&\vdots\\
0&0&\cdots&\omega_s^2
\end{pmatrix}
\end{aligned}\tag{10.41}
W ~ = = M T W M = A 1 T W A 1 A 2 T W A 1 ⋮ A s T W A 1 A 1 T W A 2 A 2 T W A 2 ⋮ A s T W A 2 ⋯ ⋯ ⋯ A 1 T W A s A 2 T W A s ⋮ A s T W A s ω 1 2 0 ⋮ 0 0 ω 2 2 ⋮ 0 ⋯ ⋯ ⋯ 0 0 ⋮ ω s 2 ( 10.41 )
最后由式(10.38)有 M − 1 = M T G \boldsymbol M^{-1}=\boldsymbol M^T\boldsymbol G M − 1 = M T G ,因此式(10.24)的逆变换可以写成
ζ = M − 1 q = M T G q (10.42) \boldsymbol\zeta=\boldsymbol M^{-1}\boldsymbol q=\boldsymbol M^T\boldsymbol G\boldsymbol q \tag{10.42}
ζ = M − 1 q = M T G q ( 10.42 )
Example 10.4 线性三原子分子的振动
如图,3 个粒子由弹簧连接,其中中间粒子的质量为 M M M ,两端粒子的质量为 m m m 。弹簧弹劲系数设为 k k k ,自由长度为 l l l 。这一模型可视为对称的线性三原子分子的简化模型。
考虑系统在稳定平衡位形附近的小振动,取广义坐标如图所示,系统的拉格朗日量为
L = 1 2 m ( x ˙ 1 2 + x ˙ 3 2 ) 2 + 1 2 M x ˙ 2 2 − 1 2 k ( x 1 − x 2 ) 2 − 1 2 ( x 2 − x 3 ) 2 L=\frac{1}{2}m(\dot x_1^2+\dot x_3^2)^2+\frac 12M\dot x_2^2-\frac12k(x_1-x_2)^2-\frac12(x_2-x_3)^2
L = 2 1 m ( x ˙ 1 2 + x ˙ 3 2 ) 2 + 2 1 M x ˙ 2 2 − 2 1 k ( x 1 − x 2 ) 2 − 2 1 ( x 2 − x 3 ) 2
已经自动具有二次拉格朗日量的形式。动能项和势能项系数矩阵为
G = ( m 0 0 0 M 0 0 0 m ) , W = ( k − k 0 − k 2 k − k 0 − k k ) \boldsymbol G=\begin{pmatrix}
m&0&0\\
0&M&0\\
0&0&m\\
\end{pmatrix},\quad
\boldsymbol W=\begin{pmatrix}
k&-k&0\\
-k&2k&-k\\
0&-k&k
\end{pmatrix}
G = m 0 0 0 M 0 0 0 m , W = k − k 0 − k 2 k − k 0 − k k
特征方程为
det ( W − ω 2 G ) = det ( k − ω 2 m − k 0 − k 2 k − ω 2 M − k 0 − k k − ω 2 m ) = − ω 2 ( m ω 2 − k ) ( m M ω 2 − k ( 2 m + M ) ) = 0 \begin{aligned}
\det(\boldsymbol W-\omega^2\boldsymbol G)=&\det\begin{pmatrix}
k-\omega^2 m& -k &0\\
-k & 2k-\omega^2M & -k\\
0 &-k & k-\omega^2m
\end{pmatrix}\\
=&-\omega^2(m\omega^2-k)(mM\omega^2-k(2m+M))=0
\end{aligned}
det ( W − ω 2 G ) = = det k − ω 2 m − k 0 − k 2 k − ω 2 M − k 0 − k k − ω 2 m − ω 2 ( m ω 2 − k ) ( m M ω 2 − k ( 2 m + M )) = 0
解的 ω 1 2 = 0 \omega_1^2=0 ω 1 2 = 0 ,ω 2 2 = k m \omega_2^2=\frac km ω 2 2 = m k ,ω 3 2 = k ( 2 m + M ) m M \omega_3^2=\frac{k(2m+M)}{mM} ω 3 2 = m M k ( 2 m + M ) ,这里 ω 1 = 0 \omega_1=0 ω 1 = 0 表示着对应的简正模式并不是振动,而是系统整体做匀速直线运动。特征矢量满足 ( W − ω α 2 G ) A α = 0 (\boldsymbol W-\omega_\alpha^2\boldsymbol G)\boldsymbol A_{\alpha}=0 ( W − ω α 2 G ) A α = 0 ,得到
A 1 = 1 2 m + M ( 1 1 1 ) , A 2 = 1 2 m ( 1 0 − 1 ) , A 3 = 1 2 m ( 1 + 2 m M ) ( 1 − 2 m M 1 ) \boldsymbol A_1=\frac{1}{\sqrt{2m+M}}\begin{pmatrix}
1\\1\\1
\end{pmatrix},\quad
\boldsymbol A_2=\frac{1}{\sqrt{2m}}\begin{pmatrix}
1\\0\\-1
\end{pmatrix},\quad
\boldsymbol A_3=\frac{1}{\sqrt{2m\left(1+2\frac mM\right)}}\begin{pmatrix}
1\\-2\frac mM\\1
\end{pmatrix}
A 1 = 2 m + M 1 1 1 1 , A 2 = 2 m 1 1 0 − 1 , A 3 = 2 m ( 1 + 2 M m ) 1 1 − 2 M m 1
这里已经将特征向量正交归一化,即满足 A β T G A α = δ α β \boldsymbol A^T_\beta\boldsymbol G\boldsymbol A_\alpha=\delta_{\alpha\beta} A β T G A α = δ α β ,因此模态矩阵为
M = ( A 1 A 2 A 3 ) = ( 1 2 m + M 1 2 m 1 2 m ( 1 + 2 m M ) 1 2 m + M 0 − 2 m M 1 1 + 2 m M 1 2 m + M − 1 2 m 1 2 m ( 1 + 2 m M ) ) \boldsymbol M=\begin{pmatrix}
\boldsymbol A_1&\boldsymbol A_2&\boldsymbol A_3
\end{pmatrix}=\begin{pmatrix}
\frac{1}{\sqrt{2m+M}}&\frac{1}{\sqrt{2m}}&\frac{1}{\sqrt{2m\left(1+2\frac mM\right)}} \\
\frac{1}{\sqrt{2m+M}}&0&-\frac{\sqrt{2m}}{M}\frac{1}{\sqrt{1+2\frac{m}{M}}} \\
\frac{1}{\sqrt{2m+M}}&-\frac 1{\sqrt{2m}}& \frac{1}{\sqrt{2m(1+2\frac mM)}}\\
\end{pmatrix}
M = ( A 1 A 2 A 3 ) = 2 m + M 1 2 m + M 1 2 m + M 1 2 m 1 0 − 2 m 1 2 m ( 1 + 2 M m ) 1 − M 2 m 1 + 2 M m 1 2 m ( 1 + 2 M m ) 1
简正坐标和原始广义坐标的关系为
ζ = ( ζ 1 ζ 2 ζ 3 ) = M T G ( x 1 x 2 x 3 ) = ( m ( x 1 + x 3 ) + M x 2 2 m + M m ( x 1 − x 3 ) 2 m M ( x 1 − 2 x 2 + x 4 ) 2 ( 2 m + M ) ) \boldsymbol \zeta=\begin{pmatrix}
\zeta_1\\
\zeta_2\\
\zeta_3
\end{pmatrix}=\boldsymbol M^T\boldsymbol G\begin{pmatrix}
x_1\\
x_2\\
x_3\\
\end{pmatrix}
=\begin{pmatrix}
\frac{m(x_1+x_3)+Mx_2}{\sqrt{2m+M}}\\
\frac{\sqrt m(x_1-x_3)}{\sqrt2}\\
\frac{\sqrt{mM}(x_1-2x_2+x_4)}{\sqrt{2(2m+M)}}
\end{pmatrix}
ζ = ζ 1 ζ 2 ζ 3 = M T G x 1 x 2 x 3 = 2 m + M m ( x 1 + x 3 ) + M x 2 2 m ( x 1 − x 3 ) 2 ( 2 m + M ) m M ( x 1 − 2 x 2 + x 4 )
第一个简正坐标 ζ 1 = 2 m + M x c \zeta_1=\sqrt{2m+M}x_c ζ 1 = 2 m + M x c ,即正比于质心坐标,因此其对应的简正模式是整体匀速直线运动。ζ 2 \zeta_2 ζ 2 对应的简正模式为中间的粒子不动,两端粒子作反向振动,频率为 ω 2 \omega_2 ω 2 。ζ 3 \zeta_3 ζ 3 对应的简正模式为中间粒子与两端粒子相对作反向振动,频率为 ω 3 \omega_3 ω 3 。
Chapter 13 哈密顿正则方程
13.1 哈密顿量
哈密顿力学的基本量是哈密顿量。由拉格朗日量 L = L ( t , q , q ˙ ) L=L(t,\boldsymbol q,\dot{\boldsymbol q}) L = L ( t , q , q ˙ ) 出发,可以定义能量函数式
h ( t , q , q ˙ ) : = ∂ L ∂ q ˙ a q ˙ a − L (13.1) h(t,\boldsymbol q,\dot{\boldsymbol q}):=\frac{\partial L}{\partial \dot q^a}\dot q^a-L \tag{13.1}
h ( t , q , q ˙ ) := ∂ q ˙ a ∂ L q ˙ a − L ( 13.1 )
注意到 ∂ L ∂ q ˙ a \frac{\partial L}{\partial \dot q^a} ∂ q ˙ a ∂ L 其实就是广义动量
p a : = ∂ L ∂ q ˙ a , a = 1 , ⋯ , s (13.2) p_a:=\frac{\partial L}{\partial \dot q^a},\quad a=1,\cdots,s\tag{13.2}
p a := ∂ q ˙ a ∂ L , a = 1 , ⋯ , s ( 13.2 )
原则上从式(13.2)可将广义速度反解为广义坐标和广义动量的函数
q ˙ a = q ˙ a ( t , q , p ) , a = 1 , ⋯ , s (13.3) \dot q^a=\dot q^a(t,\boldsymbol q,\boldsymbol p),\quad a=1,\cdots,s\tag{13.3}
q ˙ a = q ˙ a ( t , q , p ) , a = 1 , ⋯ , s ( 13.3 )
于是定义哈密顿量 (Hamiltionian)
H ( t , q , p ) : = p a q ˙ a − L (13.4) H(t,\boldsymbol q,\boldsymbol p):=p_a\dot q^a-L\tag{13.4}
H ( t , q , p ) := p a q ˙ a − L ( 13.4 )
其中的广义速度需要理解为广义坐标和广义动量的函数式(13.3)
哈密顿力学以相空间为出发点,相应的哈密顿量 H = H ( t , q , p ) H=H(t,\boldsymbol q,\boldsymbol p) H = H ( t , q , p ) 应该是相空间的函数。我们对哈密顿量做全微分
d H = d ( p a q ˙ a − L ) = d p a q ˙ a + p a d q ˙ a − ( ∂ L ∂ t d t + ∂ L ∂ q a d q a + ∂ L ∂ q ˙ a d q a ) = − ∂ L ∂ t d t − ∂ L ∂ q a q ˙ a + q ˙ a d p a + ( p a − ∂ L ∂ q ˙ a ) ⏟ = 0 d q ˙ a = − ∂ L ∂ t d t − ∂ L ∂ q a q ˙ a + q ˙ a d p a (13.5) \begin{aligned}
\mathrm dH&=\mathrm d(p_a\dot q^a-L)=\mathrm dp_a\dot q^a+p_a\mathrm d\dot q^a-\left(\frac{\partial L}{\partial t}\mathrm dt+\frac{\partial L}{\partial q^a}\mathrm dq^a+\frac{\partial L}{\partial \dot q^a}\mathrm dq^a \right)\\
&=-\frac{\partial L}{\partial t}\mathrm dt-\frac{\partial L}{\partial q^a}\dot q^a+\dot q^a\mathrm dp_a+\underbrace{\left(p_a-\frac{\partial L}{\partial \dot q^a} \right)}_{=0}\mathrm d\dot q^a\\
&=-\frac{\partial L}{\partial t}\mathrm dt-\frac{\partial L}{\partial q^a}\dot q^a+\dot q^a\mathrm dp_a
\end{aligned}\tag{13.5}
d H = d ( p a q ˙ a − L ) = d p a q ˙ a + p a d q ˙ a − ( ∂ t ∂ L d t + ∂ q a ∂ L d q a + ∂ q ˙ a ∂ L d q a ) = − ∂ t ∂ L d t − ∂ q a ∂ L q ˙ a + q ˙ a d p a + = 0 ( p a − ∂ q ˙ a ∂ L ) d q ˙ a = − ∂ t ∂ L d t − ∂ q a ∂ L q ˙ a + q ˙ a d p a ( 13.5 )
可见哈密顿量的变化 d H \mathrm dH d H 只和时间参数的变化 d t \mathrm dt d t 、广义坐标的变化 { d q a } \{\mathrm dq^a\} { d q a } 和广义动量的变化 { d p a } \{\mathrm dp_a\} { d p a } 有关,而与广义速度的变化 { d q ˙ a } \{\mathrm d\dot q^a\} { d q ˙ a } 无关。所以哈密顿量只是时间、广义坐标和广义动量的函数,与广义速度无关。
13.2 勒让德变换
13.2.1 勒让德变换的定义
从速度相空间的拉格朗日量出发,通过简单的定义式(13.4),可以得到相空间中的哈密顿量 L ( t , q , q ˙ ) → H ( t , q , p ) L(t,\boldsymbol q,\dot{\boldsymbol q})\to H(t,\boldsymbol q,\boldsymbol p) L ( t , q , q ˙ ) → H ( t , q , p ) 。重点在于,变换后的函数依赖关系改变了,即对广义速度的函数依赖被替换为对广义动量的函数依赖。从数学角度,这种操作手续即所谓勒让德变换 (Legendre transformation)。
简言之,勒让德变换就是希望换一个新的变量,用新的函数关系,来描述原来的对象。其中的新、旧变量构成共轭变量对 (conjugate variable pair)。考虑 s s s 个变量 { v 1 , ⋯ , v s } \{v^1,\cdots,v^s\} { v 1 , ⋯ , v s } 的函数 L ( v ) L(\boldsymbol v) L ( v ) ,我们希望换一组新的变量 { p 1 , ⋯ , p s } \{p_1,\cdots,p_s\} { p 1 , ⋯ , p s } ,这里 p a p_a p a 定义为
p a ≡ ∂ L ∂ v a = p a ( v ) , a = 1 , ⋯ , s (13.6) p_a\equiv\frac{\partial L}{\partial v^a}=p_a(v),\quad a=1,\cdots,s\tag{13.6}
p a ≡ ∂ v a ∂ L = p a ( v ) , a = 1 , ⋯ , s ( 13.6 )
即是对应 v a v^a v a 的共轭变量。这里 L L L 除了 { v } \{\boldsymbol v\} { v } 之外当然也可以依赖其他的变量,例如 L = L ( q , v ) L=L(\boldsymbol q,\boldsymbol v) L = L ( q , v ) ,但是我们不对 { q } \{\boldsymbol q\} { q } 做替换,亦即 { q } \{\boldsymbol q\} { q } 在勒让德变换中不起作用。在勒让德变换中,{ v } \{\boldsymbol v\} { v } 被称作主动变量,{ q } \{\boldsymbol q\} { q } 被称为被动变量。
式(13.6)给出了 { p } \{p\} { p } 作为 { v } \{v\} { v } 函数的 s s s 个代数方程。根据隐函数定理,式(13.6)的函数关系可逆,即可以从式(13.6)反解出全部 s s s 个 { v } \{\boldsymbol v\} { v } 作为 { p } \{\boldsymbol p\} { p } 的函数,从而给出 v a = v a ( p ) v^a=v^a(\boldsymbol p) v a = v a ( p ) 的充要条件为矩阵
∂ p a ∂ v b ≡ ∂ 2 L ∂ v a ∂ v b (13.7) \frac{\partial p_a}{\partial v^b}\equiv\frac{\partial^2 L}{\partial v^a\partial v^b}\tag{13.7}
∂ v b ∂ p a ≡ ∂ v a ∂ v b ∂ 2 L ( 13.7 )
非退化,这里的 ∂ 2 L ∂ v a ∂ v b \frac{\partial^2 L}{\partial v^a\partial v^b} ∂ v a ∂ v b ∂ 2 L 被称为 L L L 的黑塞矩阵 (Hessian matrix)。根据黑塞矩阵退化与否,可以分为两种情况。若黑塞矩阵非退化,即 det ( ∂ 2 L ∂ v a ∂ v b ) ≠ 0 \det\left(\frac{\partial ^2 L}{\partial v^a\partial v^b}\right)\neq 0 det ( ∂ v a ∂ v b ∂ 2 L ) = 0 。在于的函数 L L L 被称为正规 (regular)或非奇异 (non-singular)的。对于正规的 L L L 函数,式(13.6)的函数关系可逆,于是原则上可以从式(13.6)反解出所有的 { v } \{\boldsymbol v\} { v } 。若黑塞矩阵退化,即 det ( ∂ 2 L ∂ v a ∂ v b ) = 0 \det\left(\frac{\partial ^2L}{\partial v^a\partial v^b}\right)=0 det ( ∂ v a ∂ v b ∂ 2 L ) = 0 ,这样的函数 L L L 被称为非正规 (irregular)或奇异 (singular)的。对于奇异的 L L L 函数,式(13.6)的函数关系不可逆,于是无法从式(13.6)反解出所有的 { v } \{\boldsymbol v\} { v } ,而只能解出一部分。具体而言,如果黑塞矩阵的秩为 r r r ,则总是可以解出 s s s 个 { v } \{\boldsymbol v\} { v } 中的 r r r 个
v a = v a ( p ; v r + 1 , ⋯ , v s ) , a = 1 , ⋯ , r (13.8) v^a=v^a(\boldsymbol p;v^{r+1},\cdots,v^s),\quad a=1,\cdots,r\tag{13.8}
v a = v a ( p ; v r + 1 , ⋯ , v s ) , a = 1 , ⋯ , r ( 13.8 )
剩余的 s − r s-r s − r 个 { v r + 1 , ⋯ , v s } \{v^{r+1},\cdots,v^s\} { v r + 1 , ⋯ , v s } 则无法解出。
函数 L = L ( v ) L= L(\boldsymbol v) L = L ( v ) 的勒让德变换定义为
H ≡ p a v a − L ( v ) (13.9) H\equiv p_av^a-L(\boldsymbol v) \tag{13.9}
H ≡ p a v a − L ( v ) ( 13.9 )
由式(13.6)知,新变量 { p } \{\boldsymbol p\} { p } 是旧变量 { v } \{\boldsymbol v\} { v } 的函数,于是变换后的新函数 H H H 也可以被视为旧变量 { v } \{\boldsymbol v\} { v } 的函数。但是,勒让德变换的巧妙之处在于——即使 H H H 被视为 { v } \{\boldsymbol v\} { v } 的函数,旧变量 { v } \{\boldsymbol v\} { v } 进入 H H H 的方式也是非常特殊的。形象点说,旧变量 { v } \{\boldsymbol v\} { v } 总是通过新变量 { p ( v ) } \{\boldsymbol p(\boldsymbol v)\} { p ( v )} 这样的特殊组合“打包”进入 H H H 的,即 H = H ( p ( v ) ) H=H(\boldsymbol p(\boldsymbol v)) H = H ( p ( v )) 。这一点可以直接验证
d H = d ( p a v a − L ( v ) ) = d p a v a + p a d v a − ∂ L ∂ v a d v a = v a d p a + ( p a − ∂ L ∂ v a ) ⏟ = 0 d v a = v a d p a (13.10) \begin{aligned}
\mathrm dH&=\mathrm d\left(p_av^a-L(\boldsymbol v)\right)=\mathrm dp_av^a+p_a\mathrm dv^a-\frac{\partial L}{\partial v^a}\mathrm dv^a\\
&=v^a\mathrm dp_a+\underbrace{\left(p_a-\frac{\partial L}{\partial v^a} \right)}_{=0}\mathrm dv^a=v^a\mathrm dp_a
\end{aligned}\tag{13.10}
d H = d ( p a v a − L ( v ) ) = d p a v a + p a d v a − ∂ v a ∂ L d v a = v a d p a + = 0 ( p a − ∂ v a ∂ L ) d v a = v a d p a ( 13.10 )
于是,H H H 的变化只和新变量 { p } \{\boldsymbol p\} { p } 的变化有关,所以 H H H 只是新变量 { p } \{\boldsymbol p\} { p } 的函数。需要强调的是,整个推导过程我们只用到了 p a p_a p a 的定义式(13.6),而并没有涉及 L L L 是否正规,或者是勒让德变换是否可逆。换句话说,无论 L L L 是否正规,勒让德变换得到的新函数 H H H 都只是新变量 { p } \{\boldsymbol p\} { p } 的函数。
既然 H H H 只是 { p } \{\boldsymbol p\} { p } 的函数,必然有
d H ( p ) = ∂ H ( p ) ∂ p a d p a (13.11) \mathrm dH(\boldsymbol p)=\frac{\partial H(\boldsymbol p)}{\partial p_a}\mathrm dp_a \tag{13.11}
d H ( p ) = ∂ p a ∂ H ( p ) d p a ( 13.11 )
对比式(13.10),得到
( v a − ∂ H ( p ) ∂ p a ) d p a = 0 (13.12) \left(v^a-\frac{\partial H(\boldsymbol p)}{\partial p_a} \right)\mathrm dp_a=0\tag{13.12}
( v a − ∂ p a ∂ H ( p ) ) d p a = 0 ( 13.12 )
接下需要区分两种情况。对于正规的 L L L 函数,勒让德变换可逆,因此 s s s 个 { p } \{\boldsymbol p\} { p } 是相互独立的,从式(13.12)可以得到 s s s 个方程
v a = ∂ H ( p ) ∂ p a ≡ v a ( p ) , a = 1 , ⋯ , s (13.13) v^a=\frac{\partial H(\boldsymbol p)}{\partial p_a}\equiv v^a(\boldsymbol p),\quad a=1,\cdots,s\tag{13.13}
v a = ∂ p a ∂ H ( p ) ≡ v a ( p ) , a = 1 , ⋯ , s ( 13.13 )
从而可以完全解出 s s s 个 { v } \{\boldsymbol v\} { v } ,这也正是式(13.6)的反函数关系。对于奇异的 L L L 函数,勒让德变换式(13.9)不可逆,这意味着 s s s 个 { p } \{\boldsymbol p\} { p } 并不是完全独立的,所以无法由式(13.12)得到 s s s 个独立方程,从而解出全部 s s s 个 { v } \{\boldsymbol v\} { v } 。新变量 { p } \{\boldsymbol p\} { p } 并不完全独立意味着它们(亦即被动变量)之间存在约束。严格来说,式(13.9)定义的勒让德变换只对正规系统才成立,而对于奇异系统,式(13.9)的定义需要拓展。
Example 13.1 正规系统的勒让德变换
考虑两个变量 { v 1 , v 2 } \{v^1,v^2\} { v 1 , v 2 } 的函数 L = 1 2 m 1 ( v 1 ) 2 + 1 2 m 2 ( v 2 ) 2 L=\frac 12m_1(v^1)^2+\frac 12m_2(v^2)^2 L = 2 1 m 1 ( v 1 ) 2 + 2 1 m 2 ( v 2 ) 2 。因此 L L L 的黑塞矩阵非退化
det ( ∂ 2 L ∂ v a ∂ v b ) = det ( ∂ 2 L ∂ v 1 ∂ v 1 ∂ 2 L ∂ v 1 ∂ v 2 ∂ 2 L ∂ v 2 ∂ v 1 ∂ 2 L ∂ v 2 ∂ v 2 ) = det ( m 1 0 0 m 2 ) = m 1 m 2 ≠ 0 \det\left(\frac{\partial ^2L}{\partial v^a\partial v^b}\right)=\det\begin{pmatrix}
\frac{\partial ^2L}{\partial v^1\partial v^1} &\frac{\partial ^2L}{\partial v^1\partial v^2}\\
\frac{\partial ^2L}{\partial v^2\partial v^1}&\frac{\partial ^2L}{\partial v^2\partial v^2}
\end{pmatrix}=\det\begin{pmatrix}
m_1 &0\\
0 & m_2
\end{pmatrix}=m_1m_2\neq0
det ( ∂ v a ∂ v b ∂ 2 L ) = det ( ∂ v 1 ∂ v 1 ∂ 2 L ∂ v 2 ∂ v 1 ∂ 2 L ∂ v 1 ∂ v 2 ∂ 2 L ∂ v 2 ∂ v 2 ∂ 2 L ) = det ( m 1 0 0 m 2 ) = m 1 m 2 = 0
因此这是个正规系统。定义新变量为
p 1 ≡ ∂ L ∂ v 1 = m 1 v 1 , p 2 ≡ ∂ L ∂ v 2 = m 2 v 2 p_1\equiv \frac{\partial L}{\partial v^1}=m_1v^1,\quad p_2\equiv \frac{\partial L}{\partial v^2}=m_2v^2
p 1 ≡ ∂ v 1 ∂ L = m 1 v 1 , p 2 ≡ ∂ v 2 ∂ L = m 2 v 2
L L L 的勒让德变换为
H = p 1 v 1 + p 2 v 2 − 1 2 m 1 ( v 1 ) 2 − 1 2 m 2 ( v 2 ) 2 = p 1 2 2 m 1 + p 2 2 2 m 2 H=p_1v^1+p_2v^2-\frac 12m_1(v^1)^2-\frac 12m_2(v^2)^2=\frac{p_1^2}{2m_1}+\frac{p_2^2}{2m_2}
H = p 1 v 1 + p 2 v 2 − 2 1 m 1 ( v 1 ) 2 − 2 1 m 2 ( v 2 ) 2 = 2 m 1 p 1 2 + 2 m 2 p 2 2
13.2.2 勒让德变换的几何意义
给一条曲线,通常的描述方式是建立坐标系,按照“横轴-纵轴”的方式给出曲线方程。如图所示,横轴为 $v$ ,纵轴为 $L$ ,给出横轴-纵轴亦即 $v-L$ 之间的函数关系,即给出了曲线方程 $L=L(v)$
而勒让德变换则是换一种思路描述同一条曲线。如图所示,曲线 L = L ( v ) L=L(v) L = L ( v ) 在 v = v ∗ v=v_* v = v ∗ 处切线斜率为
d L ( v ) d v ∣ v ∗ = L ′ ( v ∗ ) ≡ p ( v ∗ ) (13.14) \left.\frac{\mathrm dL(v)}{\mathrm dv}\right|_{v_*}=L'(v_*)\equiv p(v_*)\tag{13.14}
d v d L ( v ) v ∗ = L ′ ( v ∗ ) ≡ p ( v ∗ ) ( 13.14 )
假设函数 L ( v ) L(v) L ( v ) 是严格凸(convex)的,则 p ( v ∗ ) p(v_*) p ( v ∗ ) 是单调增加的。于是,斜率 p p p 和 v ∗ v_* v ∗ 之间纯在一一对应的映射,由式(13.14)给出。亦即,给的斜率 p p p 的值,就能定出曲线上一点 { v , L } = { v ∗ , L ( v ∗ ) } \{v,L\}=\{v_*,L(v_*)\} { v , L } = { v ∗ , L ( v ∗ )} ,这里 v ∗ = v ∗ ( p ) v_*=v_*(p) v ∗ = v ∗ ( p ) 由式(13.14)反解得到。而曲线通过这一点的切线方程为 L − L ( v ∗ ) = p ( v ∗ ) ( v − v ∗ ) L-L(v_*)=p(v_*)(v-v_*) L − L ( v ∗ ) = p ( v ∗ ) ( v − v ∗ ) ,整理得到
p ( v ∗ ) v ∗ − L ( v ∗ ) ⏟ = H = p ( v ∗ ) v − L (13.15) \underbrace{p(v_*)v_*-L(v_*)}_{=H}=p(v_*)v-L \tag{13.15}
= H p ( v ∗ ) v ∗ − L ( v ∗ ) = p ( v ∗ ) v − L ( 13.15 )
式(13.15)的左边式斜率 p p p 的函数
H ( p ) = p v ∗ ( p ) − L ( v ∗ ( p ) ) (13.16) H(p)=pv_*(p)-L(v_*(p))\tag{13.16}
H ( p ) = p v ∗ ( p ) − L ( v ∗ ( p )) ( 13.16 )
正是 L ( v ) L(v) L ( v ) 的勒让德变换。切线在竖轴上的截距不是别的,正是 L ( v = 0 ) = − H ( p ) L(v=0)=-H(p) L ( v = 0 ) = − H ( p ) 。可见,勒让德变换不再是“横轴-纵轴”式的描述,而是“切线-截距”式的描述。完整的曲线可以被视为所有切线的包络。
13.3 相空间中的运动方程
13.3.1 正则
何谓正则,在物理学的概念中一般是强调其标准型和唯一性,这一概念背后有着深刻的模式分解 (mode decomposition)的思想。
13.3.2 从拉格朗日方程到哈密顿正则方程
从现在开始,我们只考虑正规系统,即拉格朗日量 L L L 对广义速度的黑塞矩阵非退化 det ( ∂ 2 L ∂ q ˙ a q ˙ b ) ≠ 0 \det\left(\frac{\partial^2 L}{\partial \dot q^a\dot q^b} \right)\neq 0 det ( ∂ q ˙ a q ˙ b ∂ 2 L ) = 0 ,系统不存在约束。哈密顿量只是广义坐标和广义动量的函数,有
d H = ∂ H ∂ t d t + ∂ H ∂ q a d q a + ∂ H ∂ p a d p a (13.17) \mathrm dH=\frac{\partial H}{\partial t}\mathrm dt+\frac{\partial H}{\partial q^a}\mathrm dq^a+\frac{\partial H}{\partial p_a}\mathrm d p_a\tag{13.17}
d H = ∂ t ∂ H d t + ∂ q a ∂ H d q a + ∂ p a ∂ H d p a ( 13.17 )
另一方面,利用拉格朗日方程 ( p ˙ a − ∂ L ∂ q a = 0 ) \left(\dot p_a-\frac{\partial L}{\partial q^a}=0\right) ( p ˙ a − ∂ q a ∂ L = 0 ) ,得到
d H = − ∂ L ∂ t d t − ∂ L ∂ q a ⏟ = 0 d q a + q ˙ a d p a = − ∂ L ∂ t d t − p ˙ a d q a + q ˙ a d p a (13.18) \mathrm dH=-\frac{\partial L}{\partial t}\mathrm dt-\underbrace{\frac{\partial L}{\partial q^a}}_{=0}\mathrm dq^a+\dot q^a\mathrm dp_a=-\frac{\partial L}{\partial t}\mathrm dt-\dot p_a\mathrm dq^a+\dot q^a\mathrm dp_a\tag{13.18}
d H = − ∂ t ∂ L d t − = 0 ∂ q a ∂ L d q a + q ˙ a d p a = − ∂ t ∂ L d t − p ˙ a d q a + q ˙ a d p a ( 13.18 )
对比式(13.17)和(13.18)有
q ˙ a = ∂ H ∂ p a , p ˙ a = − ∂ H ∂ q a , a = 1 , ⋯ , s (13.19) \dot q^a=\frac{\partial H}{\partial p_a},\quad \dot p_a=-\frac{\partial H}{\partial q^a},\quad a=1,\cdots,s\tag{13.19}
q ˙ a = ∂ p a ∂ H , p ˙ a = − ∂ q a ∂ H , a = 1 , ⋯ , s ( 13.19 )
式(13.19)即哈密顿正则方程 (Hamilton’s canonical equations)。式(13.17)是勒让德变换的数学结果,而式(13.18)则用到了拉格朗日方程。哈密顿正则方程和拉格朗日方程完全等价。拉格朗日方程是关于广义坐标 { q } \{\boldsymbol q\} { q } 的 s s s 个二阶常微分方程,而哈密顿正则方程则是关于广义坐标和广义动量 { q , p } \{\boldsymbol q,\boldsymbol p\} { q , p } 的 2 s 2s 2 s 个一阶常微分方程。
当运动方程满足时,哈密顿量对时间的全导数满足 d H d t = − ∂ L ∂ t \frac{\mathrm dH}{\mathrm dt}=-\frac{\partial L}{\partial t} d t d H = − ∂ t ∂ L ,由是(13.18)知,哈密顿量对时间的偏导数满足 ∂ H ∂ t = − ∂ L ∂ t \frac{\partial H}{\partial t}=-\frac{\partial L}{\partial t} ∂ t ∂ H = − ∂ t ∂ L ,总之即有
d H d t = ∂ H ∂ t = − ∂ L ∂ t (13.20) \frac{\mathrm dH}{\mathrm dt}=\frac{\partial H}{\partial t}=-\frac{\partial L}{\partial t}\tag{13.20}
d t d H = ∂ t ∂ H = − ∂ t ∂ L ( 13.20 )
哈密顿量对时间的全导数等于其对时间的偏导数,也可以直接利用哈密顿正则方程验证
d H d t = ∂ H ∂ t + ∂ H ∂ q a q ˙ a + ∂ H ∂ p a p ˙ a = ∂ H ∂ t + ∂ H ∂ q a ∂ H ∂ p a − ∂ H ∂ p a ∂ H ∂ q a = ∂ H ∂ t (13.21) \frac{\mathrm d H}{\mathrm d t}=\frac{\partial H}{\partial t}+\frac{\partial H}{\partial q^a}\dot q^a+\frac{\partial H}{\partial p_a}\dot p_a=\frac{\partial H}{\partial t}+\frac{\partial H}{\partial q^a}\frac{\partial H}{\partial p_a}-\frac{\partial H}{\partial p_a}\frac{\partial H}{\partial q^a}=\frac{\partial H}{\partial t}\tag{13.21}
d t d H = ∂ t ∂ H + ∂ q a ∂ H q ˙ a + ∂ p a ∂ H p ˙ a = ∂ t ∂ H + ∂ q a ∂ H ∂ p a ∂ H − ∂ p a ∂ H ∂ q a ∂ H = ∂ t ∂ H ( 13.21 )
“全导数”衡量的的物理量真实的时间演化,而“偏导数”只是反映时间参数 t t t 改变(例如平移)引起的物理量形式上的变化。因此,式(13.20)意味着若系统不显含时间,即不依赖于时间平移,则哈密顿量是运动常数。
Example 13.4 一维谐振子的哈密顿正则方程
一维谐振子的拉格朗日量为 L = 1 2 m q ˙ 2 − 1 2 m ω 2 q 2 L=\frac{1}{2}m\dot q^2-\frac12m\omega^2q^2 L = 2 1 m q ˙ 2 − 2 1 m ω 2 q 2 ,广义动量为 p = ∂ L ∂ q ˙ = m q ˙ p=\frac{\partial L}{\partial \dot q}=m\dot q p = ∂ q ˙ ∂ L = m q ˙ ,解的 q ˙ = p m \dot q=\frac pm q ˙ = m p 。于是
H ( p , q ) = p q ˙ − L = p p m − 1 2 m p 2 m 2 + 1 2 m ω 2 q 2 = p 2 2 m + 1 2 m ω 2 q 2 H(p,q)=p\dot q-L=p\frac pm-\frac 12 m\frac{p^2}{m^2}+\frac 12m\omega^2q^2=\frac{p^2}{2m}+\frac{1}2m\omega^2q^2
H ( p , q ) = p q ˙ − L = p m p − 2 1 m m 2 p 2 + 2 1 m ω 2 q 2 = 2 m p 2 + 2 1 m ω 2 q 2
哈密顿正则方程为
q ˙ = ∂ H ∂ p = p m , p ˙ = − ∂ H ∂ q = − m ω 2 q \dot q=\frac{\partial H}{\partial p}=\frac{p}{m},\quad \dot p=-\frac{\partial H}{\partial q}=-m\omega^2q
q ˙ = ∂ p ∂ H = m p , p ˙ = − ∂ q ∂ H = − m ω 2 q
Example 13.5 闵氏空间中自由粒子的哈密顿正则方程
闵氏空间中自由粒子的拉格朗日量为 L = − m c 2 1 − v 2 c 2 L=-mc^2\sqrt{1-\frac{\boldsymbol v^2}{c^2}} L = − m c 2 1 − c 2 v 2 ,广义动量为 p i = m v i 1 − v 2 c 2 p_i=\frac{mv_i}{\sqrt{1-\frac{\boldsymbol v^2}{c^2}}} p i = 1 − c 2 v 2 m v i 。于是
H = p i v i − L = m v 2 1 − v 2 c 2 + m c 2 1 − v 2 c 2 H=p_iv^i-L=\frac{m\boldsymbol v^2}{\sqrt{1-\frac{\boldsymbol v^2}{c^2}}}+mc^2\sqrt{1-\frac{\boldsymbol v^2}{c^2}}
H = p i v i − L = 1 − c 2 v 2 m v 2 + m c 2 1 − c 2 v 2
由 p 2 = δ i j p i p j = m 2 v 2 1 − v 2 c 2 \boldsymbol p^2=\delta^{ij}p_ip_j=\frac{m^2\boldsymbol v^2}{1-\frac{\boldsymbol v^2}{c^2}} p 2 = δ ij p i p j = 1 − c 2 v 2 m 2 v 2 ,解的 v 2 = c 2 p 2 m 2 c 2 + p 2 \boldsymbol v^2=\frac{c^2\boldsymbol p^2}{m^2c^2+\boldsymbol p^2} v 2 = m 2 c 2 + p 2 c 2 p 2 ,代入哈密顿量中
H ( x , p ) = c 4 m 2 + c 2 p 2 ≡ E H(\boldsymbol x,\boldsymbol p)=\sqrt{c^4m^2+c^2\boldsymbol p^2}\equiv E
H ( x , p ) = c 4 m 2 + c 2 p 2 ≡ E
闵氏空间自由粒子中的哈密顿正则方程为
x ˙ i = ∂ H ∂ p i = c 2 p i c 2 m 2 + c 2 p 2 , p ˙ i = − ∂ H ∂ x i = 0 , i = 1 , 2 , 3 \dot x^i=\frac{\partial H}{\partial p_i}=\frac{c^2 p^i}{\sqrt{c^2m^2+c^2\boldsymbol p^2}},\quad \dot p_i=-\frac{\partial H}{\partial x^i}=0,\quad i=1,2,3
x ˙ i = ∂ p i ∂ H = c 2 m 2 + c 2 p 2 c 2 p i , p ˙ i = − ∂ x i ∂ H = 0 , i = 1 , 2 , 3
第一个方程意味着粒子在做匀速直线运动,第二个方程意味着动量守恒。
Example 13.6 中心势场中非相对论性粒子的哈密顿正则方程
非相对论性粒子在中心势场中的拉格朗日量为 L = 1 2 m ( r ˙ 2 + r 2 θ ˙ 2 + r 2 sin 2 θ ϕ ˙ 2 ) − V ( r ) L=\frac 12m(\dot r^2+r^2\dot \theta^2+r^2\sin^2\theta \dot \phi^2)-V(r) L = 2 1 m ( r ˙ 2 + r 2 θ ˙ 2 + r 2 sin 2 θ ϕ ˙ 2 ) − V ( r ) ,广义动量为
p r ≡ ∂ L ∂ r ˙ = m r ˙ ⇒ r ˙ = p r m p θ ≡ ∂ L ∂ θ ˙ = m r 2 θ ˙ ⇒ θ ˙ = p θ m r 2 p ϕ ≡ ∂ L ∂ ϕ = m r 2 sin 2 θ ϕ ˙ ⇒ ϕ ˙ = p ϕ m r 2 sin 2 θ \begin{aligned}
&p_r\equiv\frac{\partial L}{\partial \dot r}=m\dot r\quad \Rightarrow \quad \dot r=\frac{p_r}{m} \\
&p_\theta\equiv\frac{\partial L}{\partial \dot \theta}=mr^2\dot \theta\quad \Rightarrow \quad \dot \theta=\frac{p_\theta}{mr^2} \\
&p_\phi\equiv\frac{\partial L}{\partial \phi}=mr^2\sin^2\theta\dot \phi\quad \Rightarrow\quad \dot \phi=\frac{p_\phi}{mr^2\sin^2\theta}
\end{aligned}
p r ≡ ∂ r ˙ ∂ L = m r ˙ ⇒ r ˙ = m p r p θ ≡ ∂ θ ˙ ∂ L = m r 2 θ ˙ ⇒ θ ˙ = m r 2 p θ p ϕ ≡ ∂ ϕ ∂ L = m r 2 sin 2 θ ϕ ˙ ⇒ ϕ ˙ = m r 2 sin 2 θ p ϕ
于是哈密顿量为
H = p r r ˙ + p θ θ ˙ + p ϕ ϕ ˙ − L = p r p r m + p θ p θ m r 2 + p ϕ p ϕ m r 2 sin 2 θ − 1 2 m [ ( p r m ) 2 + r 2 ( p θ m r 2 ) 2 + r 2 sin 2 θ ( p ϕ m r 2 sin 2 θ ) 2 ] + V ( r ) = p r 2 2 m + p θ 2 2 m r 2 + p ϕ 2 2 m r 2 sin 2 θ + V ( r ) \begin{aligned}
H=&p_r\dot r+p_\theta\dot \theta+p_\phi\dot \phi-L\\
=&p_r\frac{p_r}{m}+p_\theta\frac{p_\theta}{mr^2}+p_\phi\frac{p_\phi}{mr^2\sin^2\theta}\\
&-\frac 12m\left[\left(\frac{p_r}{m} \right)^2+r^2\left(\frac{p_\theta}{mr^2} \right)^2+r^2\sin^2\theta\left(\frac{p_\phi}{mr^2\sin^2\theta} \right)^2 \right]+V(r)\\
=& \frac{p_r^2}{2m}+\frac{p_\theta^2}{2mr^2}+\frac{p_\phi^2}{2mr^2\sin^2\theta}+V(r)
\end{aligned}
H = = = p r r ˙ + p θ θ ˙ + p ϕ ϕ ˙ − L p r m p r + p θ m r 2 p θ + p ϕ m r 2 sin 2 θ p ϕ − 2 1 m [ ( m p r ) 2 + r 2 ( m r 2 p θ ) 2 + r 2 sin 2 θ ( m r 2 sin 2 θ p ϕ ) 2 ] + V ( r ) 2 m p r 2 + 2 m r 2 p θ 2 + 2 m r 2 sin 2 θ p ϕ 2 + V ( r )
哈密顿正则方程为
r ˙ = ∂ H ∂ p r = p r m , θ ˙ = ∂ L ∂ p θ = p θ m r 2 , ϕ ˙ = ∂ H ∂ p ϕ = p ϕ m r 2 sin 2 θ \dot r=\frac{\partial H}{\partial p_r}=\frac{p_r}{m},\quad \dot \theta=\frac{\partial L}{\partial p_\theta}=\frac{p_\theta}{mr^2},\quad \dot\phi=\frac{\partial H}{\partial p_\phi}=\frac{p_\phi}{mr^2\sin^2\theta}
r ˙ = ∂ p r ∂ H = m p r , θ ˙ = ∂ p θ ∂ L = m r 2 p θ , ϕ ˙ = ∂ p ϕ ∂ H = m r 2 sin 2 θ p ϕ
以及
p ˙ r = − ∂ H ∂ r = p θ 2 m r 3 + p ϕ 2 m r 3 sin 2 θ − d V ( r ) d t p ˙ θ = − ∂ H ∂ θ = p ϕ 2 cos θ m r 2 sin 3 θ , p ˙ ϕ = − ∂ H ∂ ϕ = 0 \begin{aligned}
&\dot p_r=-\frac{\partial H}{\partial r}=\frac{p_\theta^2}{mr^3}+\frac{p_\phi^2}{mr^3\sin^2\theta}-\frac{\mathrm dV(r)}{\mathrm dt}\\
&\dot p_\theta=-\frac{\partial H}{\partial \theta}=\frac{p_\phi^2\cos\theta}{mr^2\sin^3\theta},\quad \dot p_\phi=-\frac{\partial H}{\partial \phi}=0
\end{aligned}
p ˙ r = − ∂ r ∂ H = m r 3 p θ 2 + m r 3 sin 2 θ p ϕ 2 − d t d V ( r ) p ˙ θ = − ∂ θ ∂ H = m r 2 sin 3 θ p ϕ 2 cos θ , p ˙ ϕ = − ∂ ϕ ∂ H = 0
在位形空间中,并不是所有关于广义坐标的微分方程都是拉格朗日方程,即存在对应的拉格朗日量。同样,在相空间中,并不是所有关于广义坐标和广义动量的方程
q ˙ a = u a ( t , q , p ) , p ˙ a = v a ( t , q , p ) (13.22) \dot q^a=u^a(t,\boldsymbol q,\boldsymbol p),\quad \dot p_a=v_a(t,\boldsymbol q,\boldsymbol p)\tag{13.22}
q ˙ a = u a ( t , q , p ) , p ˙ a = v a ( t , q , p ) ( 13.22 )
都是哈密顿正则方程,即存在对应的哈密顿量。由式(13.19)可知,若方程(13.22)为哈密顿正则方程,则有
∂ q ˙ a ∂ q b ≡ ∂ u a ∂ q b = ∂ 2 H ∂ q b ∂ p a , ∂ q ˙ a ∂ p b ≡ ∂ u a ∂ p b = ∂ 2 H ∂ p a ∂ p b ∂ p ˙ a ∂ q b ≡ ∂ v a ∂ q b = − ∂ 2 H ∂ q a ∂ q b , ∂ p ˙ a ∂ p b ≡ ∂ v a ∂ p b = − ∂ 2 H ∂ q a ∂ p b \begin{aligned}
&\frac{\partial \dot q^a}{\partial q^b}\equiv\frac{\partial u^a}{\partial q^b}=\frac{\partial ^2H}{\partial q^b\partial p_a},\quad \frac{\partial \dot q^a}{\partial p_b}\equiv\frac{\partial u^a}{\partial p_b}=\frac{\partial ^2H}{\partial p_a\partial p_b}\\
&\frac{\partial \dot p_a}{\partial q^b}\equiv\frac{\partial v_a}{\partial q^b}=-\frac{\partial ^2H}{\partial q^a\partial q^b},\quad \frac{\partial \dot p_a}{\partial p_b}\equiv\frac{\partial v_a}{\partial p_b}=-\frac{\partial ^2H}{\partial q^a\partial p_b}
\end{aligned}
∂ q b ∂ q ˙ a ≡ ∂ q b ∂ u a = ∂ q b ∂ p a ∂ 2 H , ∂ p b ∂ q ˙ a ≡ ∂ p b ∂ u a = ∂ p a ∂ p b ∂ 2 H ∂ q b ∂ p ˙ a ≡ ∂ q b ∂ v a = − ∂ q a ∂ q b ∂ 2 H , ∂ p b ∂ p ˙ a ≡ ∂ p b ∂ v a = − ∂ q a ∂ p b ∂ 2 H
因此函数 u a ( t , q , p ) u^a(t,\boldsymbol q,\boldsymbol p) u a ( t , q , p ) 和 v a ( t , q , p ) v_a(t,\boldsymbol q,\boldsymbol p) v a ( t , q , p ) 需要满足条件
∂ u a ∂ q b = − ∂ v b ∂ p a , ∂ u a ∂ p b = ∂ u b ∂ p a , ∂ v a ∂ q b = ∂ v b ∂ q a , a , b = 1 , ⋯ , s (13.23) \frac{\partial u^a}{\partial q^b}=-\frac{\partial v_b}{\partial p_a},\quad \frac{\partial u^a}{\partial p_b}=\frac{\partial u^b}{\partial p_a},\quad \frac{\partial v_a}{\partial q^b}=\frac{\partial v_b}{\partial q^a},\quad a,b=1,\cdots,s\tag{13.23}
∂ q b ∂ u a = − ∂ p a ∂ v b , ∂ p b ∂ u a = ∂ p a ∂ u b , ∂ q b ∂ v a = ∂ q a ∂ v b , a , b = 1 , ⋯ , s ( 13.23 )
满足式(13.23)的条件的运动方程(13.22)具有哈密顿正则方程的形式,存在对应的哈密顿量,此时系统也被称为哈密顿系统 (Hamiltonian system)。反过来,无论是由勒让德变换得到还是直接给定,只要知道系统的哈密顿量,其运动方程即由哈密顿正则方程(13.19)给出。
13.4 相空间的变分原理
根据勒让德变换关系,拉格朗日量可以反过来用哈密顿量表示为
L ( t , q , p , q ˙ , p ˙ ) : = p a q ˙ a − H ( t , q , p ) (13.24) L(t,\boldsymbol q,\boldsymbol p,\dot{\boldsymbol q},\dot{\boldsymbol p}):=p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)\tag{13.24}
L ( t , q , p , q ˙ , p ˙ ) := p a q ˙ a − H ( t , q , p ) ( 13.24 )
式(13.24)中的 L ( t , q , p , q ˙ , p ˙ ) L(t,\boldsymbol q,\boldsymbol p,\dot{\boldsymbol q},\dot{\boldsymbol p}) L ( t , q , p , q ˙ , p ˙ ) 是广义坐标、广义动量及其时间导数的函数,可以视为相空间拉格朗日量 (phase space Lagrangian)。特别是 q ˙ \dot{\boldsymbol q} q ˙ 需要理解为广义坐标 q \boldsymbol q q 的时间导数,因为相空间并没有广义速度的概念。位形空间的最小作用量原理要求在满足
δ q a ( t 1 ) = δ q a ( t 2 ) = 0 , a = 1 , ⋯ , s (13.25) \delta q^a(t_1)=\delta q^a(t_2)=0,\quad a=1,\cdots,s\tag{13.25}
δ q a ( t 1 ) = δ q a ( t 2 ) = 0 , a = 1 , ⋯ , s ( 13.25 )
的边界条件时,对任意的广义坐标的变分都有 δ S [ q ] = 0 \delta S[\boldsymbol q]=0 δ S [ q ] = 0 。相应的,在相空间中,把作用量视为 { q ( t ) , p ( t ) } \{\boldsymbol q(t),\boldsymbol p(t) \} { q ( t ) , p ( t )} 共同的泛函,要求对任意广义坐标和广义动量的变分为零。
δ S [ q , p ] ≡ ∫ t 1 t 2 d t δ [ p a q ˙ a − H ( t , q , p ) ] \delta S[\boldsymbol q,\boldsymbol p]\equiv\int_{t_1}^{t_2}\mathrm dt\delta[p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)]
δ S [ q , p ] ≡ ∫ t 1 t 2 d t δ [ p a q ˙ a − H ( t , q , p )]
这也称为相空间变分原理 (vartiational principle in phase space)。展开得到
δ S [ q , p ] = ∫ t 1 t 2 d t [ δ p a q ˙ a + p a δ q ˙ a − δ H ( t , q , p ) ] = ∫ t 1 t 2 d t [ δ p a q ˙ a + d d t ( p a δ q a ) − p ˙ a δ q a − ∂ H ∂ q a δ q a − ∂ H ∂ p a δ p a ] = ∫ t 1 t 2 d t [ ( q ˙ a − ∂ H ∂ p a ) δ p a − ( p ˙ a + ∂ H ∂ q a ) δ q a ] + ( p a δ q a ) ∣ t 1 t 2 ⏟ = 0 (13.26) \begin{aligned}
\delta S[\boldsymbol q,\boldsymbol p]=&\int_{t_1}^{t_2}\mathrm dt[\delta p_a\dot q^a+p_a\delta \dot q^a-\delta H(t,\boldsymbol q,\boldsymbol p)]\\
=&\int_{t_1}^{t_2}\mathrm dt\left[\delta p_a\dot q^a+\frac{\mathrm d}{\mathrm dt}(p_a\delta q^a)-\dot p_a\delta q^a-\frac{\partial H}{\partial q^a}\delta q^a-\frac{\partial H}{\partial p_a}\delta p_a \right]\\
=&\int_{t_1}^{t_2}\mathrm dt\left[\left(\dot q^a-\frac{\partial H}{\partial p_a}\right)\delta p_a-\left(\dot p_a+\frac{\partial H}{\partial q^a} \right)\delta q^a \right]+\underbrace{\left.(p_a\delta q^a)\right|_{t_1}^{t_2}}_{=0}
\end{aligned}
\tag{13.26}
δ S [ q , p ] = = = ∫ t 1 t 2 d t [ δ p a q ˙ a + p a δ q ˙ a − δH ( t , q , p )] ∫ t 1 t 2 d t [ δ p a q ˙ a + d t d ( p a δ q a ) − p ˙ a δ q a − ∂ q a ∂ H δ q a − ∂ p a ∂ H δ p a ] ∫ t 1 t 2 d t [ ( q ˙ a − ∂ p a ∂ H ) δ p a − ( p ˙ a + ∂ q a ∂ H ) δ q a ] + = 0 ( p a δ q a ) ∣ t 1 t 2 ( 13.26 )
可以验证,哈密顿正则方程就是相空间拉格朗日量式(13.24)对应的欧拉-拉格朗日方程
d d t ( ∂ L ∂ q ˙ a ) − ∂ L ∂ q a = 0 ⇒ p ˙ a + ∂ H ∂ q a = 0 (13.27) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\right)-\frac{\partial L}{\partial q^a}=0\quad \Rightarrow \quad \dot p_a+\frac{\partial H}{\partial q^a}=0\tag{13.27}
d t d ( ∂ q ˙ a ∂ L ) − ∂ q a ∂ L = 0 ⇒ p ˙ a + ∂ q a ∂ H = 0 ( 13.27 )
d d t ( ∂ L ∂ p ˙ a ) − ∂ L ∂ p a = 0 ⇒ q ˙ a − ∂ H ∂ p a = 0 (13.28) \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot p_a} \right)-\frac{\partial L}{\partial p_a}=0\quad \Rightarrow\quad \dot q^a-\frac{\partial H}{\partial p_a}=0\tag{13.28}
d t d ( ∂ p ˙ a ∂ L ) − ∂ p a ∂ L = 0 ⇒ q ˙ a − ∂ p a ∂ H = 0 ( 13.28 )
我们进一步要求
δ p a ( t 1 ) = δ p a ( t 2 ) = 0 , a = 1 , ⋯ , s (13.29) \delta p_a(t_1)=\delta p_a(t_2)=0,\quad a=1,\cdots,s\tag{13.29}
δ p a ( t 1 ) = δ p a ( t 2 ) = 0 , a = 1 , ⋯ , s ( 13.29 )
此时相空间拉格朗日量也就有相差时间全导数的任意性
p a q ˙ a − H ( t , q , p ) ≃ p a q ˙ a − H ( t , q , p ) + d F ( t , q , p ) d t (13.30) p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)\simeq p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)+\frac{\mathrm dF(t,\boldsymbol q,\boldsymbol p)}{\mathrm dt} \tag{13.30}
p a q ˙ a − H ( t , q , p ) ≃ p a q ˙ a − H ( t , q , p ) + d t d F ( t , q , p ) ( 13.30 )
13.5 相空间中的演化
哈密顿正则方程所描述的是相空间的坐标,即系统状态的演化。更一般地,系统的力学量或者说可观测量 (observable)由状态决定,即相空间坐标的函数
物理系统在任意时刻的状态可以用其相空间中的一个点来表示,称为这个系统在其相空间中的代表点。随着时间的演化,系统的代表点也会在相空间中移动,从而划出一条条轨迹,称为系统的相轨迹 (phase trajectory)或者相流 (phase flow)。对于不含时系统,相空间中的点代表系统完整的状态。从相空间中一个给定的点出发,物理系统的相流完全由哈密顿正则方程所唯一确定,即不含时系统的相流是永不相交的。相空间中相流的图示也被称作相图 (phase diagram 或 phase potrait)。通过分析相图,可以直接得到系统演化的很多性质,而不需要具体求解运动方程。
对于不含时系统,哈密顿量 H H H 是运动常数。而
H ( q , p ) = c o n s t ≡ E (13.31) H(\boldsymbol q,\boldsymbol p)=const\equiv E\tag{13.31}
H ( q , p ) = co n s t ≡ E ( 13.31 )
是 2 s 2s 2 s 维相空间中 2 s − 1 2s-1 2 s − 1 维的超曲面。因此,不含时系统的相轨迹在相空间中 H = c o n s t H=const H = co n s t 的超曲面上。对于单自由度系统,相流就是 2 维相平面上的曲线,亦即哈密顿量的等高线,如下如所示。根据哈密顿正则方程,相流的方向 v = ( q ˙ , p ˙ ) \boldsymbol v=(\dot{ q} ,\dot{ p}) v = ( q ˙ , p ˙ ) 相当于哈密顿量的梯度 ∇ H = ( ∂ H ∂ q , ∂ H ∂ p ) \nabla H=\left(\frac{\partial H}{\partial q},\frac{\partial H}{\partial p} \right) ∇ H = ( ∂ q ∂ H , ∂ p ∂ H ) 方向(由能量低指向能量高)“顺时针”转 π 2 \frac{\pi}{2} 2 π 角。
Example 13.10 单摆的相图
单摆的拉格朗日量为 L = 1 2 m l 2 θ ˙ 2 + m g l cos θ L=\frac 12 ml^2\dot \theta ^2+mgl\cos\theta L = 2 1 m l 2 θ ˙ 2 + m g l cos θ 。单摆只有 1 个自由度,其位形空间是 1 维圆周 S 1 \mathbf S^1 S 1 ,广义坐标 θ ∈ [ − π , π ) \theta \in [-\pi,\pi) θ ∈ [ − π , π ) 具有 2 π 2\pi 2 π 周期性。 θ \theta θ 的共轭动量维 p θ = ∂ L ∂ θ ˙ = m l 2 θ ˙ p_\theta=\frac{\partial L}{\partial \dot \theta}=ml^2\dot\theta p θ = ∂ θ ˙ ∂ L = m l 2 θ ˙ 。于是哈密顿量为
H ( θ , p θ ) = p θ θ ˙ − L = p θ 2 2 m l 2 − m g l cos θ H(\theta,p_\theta)=p_\theta\dot\theta-L=\frac{p_\theta^2}{2ml^2}-mgl\cos\theta
H ( θ , p θ ) = p θ θ ˙ − L = 2 m l 2 p θ 2 − m g l cos θ
单摆的相空间是 2 维的,θ \theta θ 仍然具有 2 π 2\pi 2 π 的周期性,而 p θ p_\theta p θ 原则上可以取任意实数 p θ ∈ R 1 p_\theta\in \mathbf R^1 p θ ∈ R 1 ,所以单摆的相空间是一个 2 维柱面 R 1 × S 1 \mathbf R^1\times\mathbf S^1 R 1 × S 1 。单摆的相流如图所示。
Example 13.11 开普勒问题的相图
考虑在中心势场 V ( r ) = − G m r V(r)=-\frac{Gm}{r} V ( r ) = − r G m 中运动的粒子。由角动量守恒知,粒子做平面运动,取平面极坐标,拉格朗日量 L = 1 2 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) + G m r L=\frac 12m(\dot r^2+r^2\dot\phi ^2)+\frac{Gm}{r} L = 2 1 m ( r ˙ 2 + r 2 ϕ ˙ 2 ) + r G m 。哈密顿量为
H = p r 2 2 m + p ϕ 2 2 m r 2 − G m r H=\frac{p_r^2}{2m}+\frac{p_\phi^2}{2mr^2}-\frac{Gm}{r}
H = 2 m p r 2 + 2 m r 2 p ϕ 2 − r G m
由于 ϕ \phi ϕ 是循环坐标,p ϕ = c o n s t ≡ J p_\phi=const\equiv J p ϕ = co n s t ≡ J ,所以哈密顿量可写为 H = p r 2 2 m + J 2 2 m r 2 − G m r ≡ H ( r , p r ) H=\frac{p_r^2}{2m}+\frac{J^2}{2mr^2}-\frac{Gm}{r}\equiv H(r,p_r) H = 2 m p r 2 + 2 m r 2 J 2 − r G m ≡ H ( r , p r ) ,即等效为径向运动单自由度问题。 { r , p r } \{r,p_r\} { r , p r } 平面上的相图如图所示
补充
A.非惯性系
拉格朗日方程的坐标变化不变性可以被用以方便地讨论非惯性系中的问题。
A.1 加速参考系
设参考系 ( x ′ , y ′ , z ′ ) (x',y',z') ( x ′ , y ′ , z ′ ) 相对于惯性系 ( x , y , z ) (x,y,z) ( x , y , z ) 做加速运动而没有转动。设 r ⃗ ( t ) \vec r(t) r ( t ) 、R ⃗ ( t ) \vec R(t) R ( t ) 、r ⃗ ′ ( t ) \vec{r}'(t) r ′ ( t ) 分别是质点在惯性系中、非惯性系坐标原点在惯性系中、质点在非惯性系中的位置矢量。易知
r ⃗ ( t ) = R ⃗ ( t ) + r ⃗ ′ ( t ) (A.1) \vec r(t)=\vec R(t)+\vec r'(t) \tag{A.1}
r ( t ) = R ( t ) + r ′ ( t ) ( A.1 )
对时间 t t t 求导
r ⃗ ˙ ( t ) = R ⃗ ˙ ( t ) + r ⃗ ′ ˙ ( t ) (A.2) \dot {\vec{r}}(t)=\dot{\vec R}(t)+\dot{\vec r'}(t) \tag{A.2}
r ˙ ( t ) = R ˙ ( t ) + r ′ ˙ ( t ) ( A.2 )
在惯性系中,系统的拉格朗日量为
L ( r i ⃗ , r i ⃗ ˙ , t ) = 1 2 m i r i ⃗ ˙ 2 − V ( r i ⃗ , t ) (A.3) L(\vec{ r_i},\dot{\vec {r_i}},t)=\frac 12m_i\dot{\vec {r_i}}^2-V(\vec{r_i},t) \tag{A.3}
L ( r i , r i ˙ , t ) = 2 1 m i r i ˙ 2 − V ( r i , t ) ( A.3 )
利用式(A.2),有
L ′ ( r i ⃗ ′ , r i ⃗ ˙ ′ , t ) = 1 2 m i ( R ⃗ ˙ ( t ) + r i ⃗ ˙ ′ ( t ) ) 2 − V i ( R ⃗ ( t ) + r i ⃗ ′ ( t ) , t ) = 1 2 m i r i ⃗ ˙ ′ 2 + m i r ⃗ i ˙ ′ ⋅ R ⃗ ˙ ( t ) + 1 2 m i R ⃗ ˙ 2 ( t ) − V i ( R ⃗ ( t ) + r i ⃗ ′ ( t ) , t ) (A.4) \begin{aligned}
L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\left(\dot{\vec R}(t)+\dot{\vec{r_i}}'(t) \right)^2-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right) \\
&=\frac 12m_i\dot{\vec{r_i}}'^2+m_i\dot{\vec r_i}'\cdot\dot{\vec R}(t)+\frac 12m_i
\dot{\vec R}^2(t)-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right)
\end{aligned}\tag{A.4}
L ′ ( r i ′ , r i ˙ ′ , t ) = 2 1 m i ( R ˙ ( t ) + r i ˙ ′ ( t ) ) 2 − V i ( R ( t ) + r i ′ ( t ) , t ) = 2 1 m i r i ˙ ′2 + m i r i ˙ ′ ⋅ R ˙ ( t ) + 2 1 m i R ˙ 2 ( t ) − V i ( R ( t ) + r i ′ ( t ) , t ) ( A.4 )
利用拉格朗日方程
d d t ∂ L ∂ r i ⃗ ˙ ′ − ∂ L ∂ r ⃗ ′ = 0 (A.5) \frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot{\vec{r_i}}'}-\frac{\partial L}{\partial \vec r'}=0\tag{A.5}
d t d ∂ r i ˙ ′ ∂ L − ∂ r ′ ∂ L = 0 ( A.5 )
得到
m i r i ⃗ ¨ ′ = − m i R ⃗ ¨ − ∂ V i ∂ r i ⃗ ′ (A.6) m_i\ddot{\vec{r_i}}'=-m_i\ddot{\vec R}-\frac{\partial V_i}{\partial \vec{r_i}'}\tag{A.6}
m i r i ¨ ′ = − m i R ¨ − ∂ r i ′ ∂ V i ( A.6 )
对于式(A.4),有
L ′ ( r i ⃗ ′ , r i ⃗ ˙ ′ , t ) = 1 2 m i r i ⃗ ˙ ′ 2 − m i r ⃗ i ′ ⋅ R ⃗ ¨ ( t ) + 1 2 m i R ⃗ ˙ 2 ( t ) − V i ( R ⃗ ( t ) + r i ⃗ ′ ( t ) , t ) + d d t ( m i r i ⃗ ′ ⋅ R ⃗ ˙ ( t ) ) (A.7) \begin{aligned}
L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\dot{\vec{r_i}}'^2-m_i{\vec r_i}'\cdot\ddot{\vec R}(t)+\frac 12m_i
\dot{\vec R}^2(t)-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right)+\frac{\mathrm d}{\mathrm dt}\left(m_i\vec{r_i}'\cdot\dot{\vec R}(t) \right)
\end{aligned}\tag{A.7}
L ′ ( r i ′ , r i ˙ ′ , t ) = 2 1 m i r i ˙ ′2 − m i r i ′ ⋅ R ¨ ( t ) + 2 1 m i R ˙ 2 ( t ) − V i ( R ( t ) + r i ′ ( t ) , t ) + d t d ( m i r i ′ ⋅ R ˙ ( t ) ) ( A.7 )
忽略边界项,可以定义有效势能
V e f f i ( r i ⃗ ′ ( t ) , t ) = V i + m i r i ⃗ ′ ⋅ R ⃗ ¨ ( t ) − 1 2 m i R ⃗ ˙ 2 ( t ) (A.8) V_{eff_i}(\vec{r_i}'(t),t)=V_i+m_i\vec{r_i}'\cdot\ddot{\vec R}(t)-\frac 12m_i\dot{\vec R}^2(t) \tag{A.8}
V e f f i ( r i ′ ( t ) , t ) = V i + m i r i ′ ⋅ R ¨ ( t ) − 2 1 m i R ˙ 2 ( t ) ( A.8 )
得到
L ′ ( r i ⃗ ′ , r i ⃗ ˙ ′ , t ) = 1 2 m i r i ⃗ ˙ ′ 2 − V e f f i ( r i ⃗ ′ ( t ) , t ) (A.9) \begin{aligned}
L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\dot{\vec{r_i}}'^2-V_{eff_i}\left(\vec{r_i}'(t),t \right)
\end{aligned}\tag{A.9}
L ′ ( r i ′ , r i ˙ ′ , t ) = 2 1 m i r i ˙ ′2 − V e f f i ( r i ′ ( t ) , t ) ( A.9 )
和 L ( r ⃗ , r ⃗ ˙ , t ) L(\vec r,\dot{\vec r},t) L ( r , r ˙ , t ) 具有相同的形式。
A.2 转动参考系
简单起见,仅考虑单质点,无相对平动的情况。设 r ⃗ \vec r r 及 r ⃗ ′ \vec r' r ′ 分别是质点在惯性系和非惯性系中的位置矢量,则有
r ⃗ = R ( t ) r ⃗ ′ (A.10) \vec r=\mathbf R(t)\vec r' \tag{A.10}
r = R ( t ) r ′ ( A.10 )
对时间求导,得到
r ⃗ ˙ = R ( t ) r ⃗ ˙ ’ + R ˙ ( t ) r ⃗ ′ (A.11) \dot{\vec r}=\mathbf R(t)\dot{\vec r}’+\dot{\mathbf R}(t)\vec{r}'\tag{A.11}
r ˙ = R ( t ) r ˙ ’ + R ˙ ( t ) r ′ ( A.11 )
下面我们来化简第二项 R ˙ ( t ) r ⃗ ′ \dot{\mathbf R}(t)\vec r' R ˙ ( t ) r ′ 。将等式 R T ( t ) R ( t ) = I \mathbf R^T(t)\mathbf R(t)=\mathbf I R T ( t ) R ( t ) = I 对时间求导,得
R ˙ T ( t ) R ( t ) + R T ( t ) R ˙ ( t ) = 0 (A.11) \dot{\mathbf R}^T(t)\mathbf R(t)+\mathbf R^T(t)\dot{\mathbf R}(t)=0 \tag{A.11}
R ˙ T ( t ) R ( t ) + R T ( t ) R ˙ ( t ) = 0 ( A.11 )
又 ( R T ( t ) R ˙ ( t ) ) T = R ˙ T ( t ) R ( t ) \left(\mathbf R^T(t)\dot{\mathbf R}(t)\right)^T=\dot{\mathbf R}^T(t)\mathbf R(t) ( R T ( t ) R ˙ ( t ) ) T = R ˙ T ( t ) R ( t ) ,定义三阶反对称矩阵
Ω = ( 0 − ω 3 ω 2 ω 3 0 − ω 1 − ω 2 ω 1 0 ) (A.12) \mathbf\Omega=
\begin{pmatrix}
0& -\omega_3 &\omega_2\\
\omega_3 & 0& -\omega_1\\
-\omega_2 & \omega_1 & 0
\end{pmatrix}\tag{A.12}
Ω = 0 ω 3 − ω 2 − ω 3 0 ω 1 ω 2 − ω 1 0 ( A.12 )
有
Ω = R T R ˙ ⇒ R ˙ = R Ω (A.13) \mathbf\Omega=\mathbf R^T\dot{\mathbf R}\quad \Rightarrow \quad \dot{\mathbf R}=\mathbf R\mathbf \Omega\tag{A.13}
Ω = R T R ˙ ⇒ R ˙ = RΩ ( A.13 )
所以
r ⃗ ˙ = R ( t ) ( r ⃗ ˙ ′ ( t ) + Ω ( t ) r ⃗ ′ ( t ) ) = R ( t ) ( r ⃗ ˙ ′ ( t ) + ω ⃗ ( t ) × r ⃗ ′ ( t ) ) (A.14) \dot{\vec r}=\mathbf R(t)\left(\dot{\vec r}'(t)+\mathbf\Omega(t) \vec r'(t) \right)=\mathbf R(t)\left(\dot{\vec r}'(t)+\vec \omega(t)\times\vec{r}'(t) \right) \tag{A.14}
r ˙ = R ( t ) ( r ˙ ′ ( t ) + Ω ( t ) r ′ ( t ) ) = R ( t ) ( r ˙ ′ ( t ) + ω ( t ) × r ′ ( t ) ) ( A.14 )
其中 ω ⃗ = ( ω 1 , ω 2 , ω 3 ) \vec{\omega}=(\omega_1,\omega_2,\omega_3) ω = ( ω 1 , ω 2 , ω 3 ) 。
惯性参考系中的拉格朗日量为
L ( r ⃗ , r ⃗ ˙ , t ) = 1 2 m r ⃗ ˙ 2 − V ( r ⃗ , t ) (A.15) L(\vec r,\dot{\vec r},t)=\frac 12m\dot{\vec r}^2-V(\vec r,t)\tag{A.15}
L ( r , r ˙ , t ) = 2 1 m r ˙ 2 − V ( r , t ) ( A.15 )
代入式(A.14)得
L ′ ( r ⃗ , r ⃗ ˙ , t ) = 1 2 m [ R ( t ) ( r ⃗ ˙ ′ + ω ⃗ × r ⃗ ′ ) ] 2 − V ( r ⃗ ′ , t ) = 1 2 m r ⃗ ˙ ′ 2 + m r ⃗ ˙ ′ ⋅ ( ω ⃗ × r ⃗ ′ ) + 1 2 m ( ω ⃗ × r ⃗ ′ ) 2 − V ( r ⃗ ′ , t ) (A.16) \begin{aligned}
L'(\vec r,\dot{\vec r},t)&=\frac 12m\left[\mathbf R(t)\left(\dot{\vec r}'+\vec \omega\times\vec{r}' \right) \right]^2-V(\vec r',t)\\
&=\frac 12m\dot{\vec r}'^2+m\dot{\vec r}'\cdot(\vec \omega\times\vec r')+\frac 12m(\vec \omega\times\vec r')^2-V(\vec r',t)
\end{aligned}\tag{A.16}
L ′ ( r , r ˙ , t ) = 2 1 m [ R ( t ) ( r ˙ ′ + ω × r ′ ) ] 2 − V ( r ′ , t ) = 2 1 m r ˙ ′2 + m r ˙ ′ ⋅ ( ω × r ′ ) + 2 1 m ( ω × r ′ ) 2 − V ( r ′ , t ) ( A.16 )
对于的拉格朗日方程为
d d t ∂ L ′ ∂ r ⃗ ′ ˙ − ∂ L ′ ∂ r ⃗ ′ = 0 (A.17) \frac{\mathrm d}{\mathrm dt}\frac{\partial L'}{\partial \dot{\vec r'}}-\frac{\partial L'}{\partial \vec r'}=0\tag{A.17}
d t d ∂ r ′ ˙ ∂ L ′ − ∂ r ′ ∂ L ′ = 0 ( A.17 )
其中
∂ L ′ ∂ r ⃗ ′ = − m ω ⃗ × r ⃗ ˙ ′ − m ω ⃗ × ( ω ⃗ × r ⃗ ′ ) − ∂ V ∂ r ⃗ ′ \frac{\partial L'}{\partial \vec r'}=-m\vec \omega\times\dot{\vec r}'-m\vec\omega\times(\vec \omega\times\vec r')-\frac{\partial V}{\partial \vec r'}
∂ r ′ ∂ L ′ = − m ω × r ˙ ′ − m ω × ( ω × r ′ ) − ∂ r ′ ∂ V
d d t ∂ L ′ ∂ r ⃗ ˙ ′ = d d t ( m r ⃗ ˙ ′ + m ω ⃗ × r ⃗ ′ ) = m r ⃗ ¨ ′ + m ω ⃗ ˙ × r ⃗ ′ + m ω ⃗ × r ⃗ ˙ ′ \frac{\mathrm d}{\mathrm dt}\frac{\partial L'}{\partial\dot{\vec r}'}=\frac{\mathrm d}{\mathrm dt}\left(m\dot{\vec r}'+m\vec \omega\times\vec r' \right)=m\ddot{\vec r}'+m\dot{\vec \omega}\times\vec r'+m\vec \omega\times\dot{\vec r}'
d t d ∂ r ˙ ′ ∂ L ′ = d t d ( m r ˙ ′ + m ω × r ′ ) = m r ¨ ′ + m ω ˙ × r ′ + m ω × r ˙ ′
代入整理后得到
m r ⃗ ¨ ′ = − m ω ⃗ ˙ × r ⃗ ′ − 2 m ω ⃗ × r ⃗ ˙ ′ − m ω ⃗ × ( ω ⃗ × r ⃗ ′ ) − ∇ r ⃗ ′ V m\ddot{\vec r}'=-m\dot{\vec \omega}\times\vec r'-2m\vec\omega\times\dot{\vec r}'-m\vec \omega\times(\vec \omega\times\vec r')-\nabla_{\vec r'}V
m r ¨ ′ = − m ω ˙ × r ′ − 2 m ω × r ˙ ′ − m ω × ( ω × r ′ ) − ∇ r ′ V
右式中的第二、三、四项分别对应科里奥利力、离心力、外力。